🗊Презентация Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса

Категория: Математика
Нажмите для полного просмотра!
Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №1Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №2Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №3Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №4Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №5Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №6Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №7Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №8Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №9Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №10Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №11Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №12Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №13Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №14Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №15Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №16Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса, слайд №17

Вы можете ознакомиться и скачать презентацию на тему Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса. Доклад-сообщение содержит 17 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Беседы о прикладной статистике
Семинар 10. Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса
Описание слайда:
Беседы о прикладной статистике Семинар 10. Дисперсионный анализ для сравнения средних. Тест Крускала-Уоллиса

Слайд 2





Сравнение двух средних
На предыдущих семинарах мы обсуждали сравнение двух средних значений
В случае нормального распределения применяют, например, t-тест 
Если распределение не описывается нормальной кривой, для сравнения двух распределений используют, например, тест суммы рангов Уилкоксона (Манна-Уитни)
Описание слайда:
Сравнение двух средних На предыдущих семинарах мы обсуждали сравнение двух средних значений В случае нормального распределения применяют, например, t-тест Если распределение не описывается нормальной кривой, для сравнения двух распределений используют, например, тест суммы рангов Уилкоксона (Манна-Уитни)

Слайд 3





Сравнение нескольких средних
Если сравниваемых групп 3 и более, можно попарно сравнить группы друг с другом, например, при помощи t-теста. В таком случае количество сравнений  , где N - количество групп, которые нужно сравнить между собой
Недостаток такого подхода в том, что теряется статистическая информация из других групп. Это приводит к падению статистической мощности теста (1-ошибка второго рода)
Одним из способов решения проблемы является однофакторный дисперсионный анализ (one-way ANOVA)
Описание слайда:
Сравнение нескольких средних Если сравниваемых групп 3 и более, можно попарно сравнить группы друг с другом, например, при помощи t-теста. В таком случае количество сравнений , где N - количество групп, которые нужно сравнить между собой Недостаток такого подхода в том, что теряется статистическая информация из других групп. Это приводит к падению статистической мощности теста (1-ошибка второго рода) Одним из способов решения проблемы является однофакторный дисперсионный анализ (one-way ANOVA)

Слайд 4





Однофакторный дисперсионный анализ
H0: средние всех групп равны
Ha: хотя бы два средних различаются между собой
Дисперсии сравниваемых генеральных совокупностей равны
Задача сводится к построению линейной модели вида                            ,
где i – количество групп, j – количество наблюдений в группе. 
Параметры модели – средние значения сравниваемых генеральных совокупностей  и общее стандартное отклонение σ
Оценка  производится при помощи средних выборок по группам:
Описание слайда:
Однофакторный дисперсионный анализ H0: средние всех групп равны Ha: хотя бы два средних различаются между собой Дисперсии сравниваемых генеральных совокупностей равны Задача сводится к построению линейной модели вида , где i – количество групп, j – количество наблюдений в группе. Параметры модели – средние значения сравниваемых генеральных совокупностей и общее стандартное отклонение σ Оценка производится при помощи средних выборок по группам:

Слайд 5





Объединенная оценка дисперсии
Остатки                              отражают разброс данных вокруг средних значений по группам
Модель ANOVA предполагает, что распределение признака во всех группах нормальное и имеет одинаковую дисперсию
Объединенная (усредненная) оценка дисперсии по I группам будет иметь вид:
Тогда несмещенная оценка σ:                    
Группы с бо́льшим количеством наблюдений будут иметь больший вес
Описание слайда:
Объединенная оценка дисперсии Остатки отражают разброс данных вокруг средних значений по группам Модель ANOVA предполагает, что распределение признака во всех группах нормальное и имеет одинаковую дисперсию Объединенная (усредненная) оценка дисперсии по I группам будет иметь вид: Тогда несмещенная оценка σ: Группы с бо́льшим количеством наблюдений будут иметь больший вес

Слайд 6





Регрессия и ANOVA: одно и то же
Из модели множественной регрессии мы помним, что:
Модель ANOVA аналогична регрессионной модели, где роль линии регрессии выполняют средние по группам
Поэтому SSM записывают как SSG, что означает сумма квадратов отклонений каждого среднего от генерального среднего
Аналогично регрессии: SSE – сумма квадратов отклонений значений от внутригрупповых средних, SST – сумма квадратов отклонений каждого значения от генерального среднего
Описание слайда:
Регрессия и ANOVA: одно и то же Из модели множественной регрессии мы помним, что: Модель ANOVA аналогична регрессионной модели, где роль линии регрессии выполняют средние по группам Поэтому SSM записывают как SSG, что означает сумма квадратов отклонений каждого среднего от генерального среднего Аналогично регрессии: SSE – сумма квадратов отклонений значений от внутригрупповых средних, SST – сумма квадратов отклонений каждого значения от генерального среднего

Слайд 7





F-тест для дисперсионного анализа
Несложно догадаться, что                              и   
Степени свободы для всех отклонений и F-тест :
                                                                                                        
                                                Подчиняется распределению F(I-1, N-I)
Описание слайда:
F-тест для дисперсионного анализа Несложно догадаться, что и Степени свободы для всех отклонений и F-тест : Подчиняется распределению F(I-1, N-I)

Слайд 8





Пример
Имеем 3 переменных, в каждой 3 наблюдения:
Описание слайда:
Пример Имеем 3 переменных, в каждой 3 наблюдения:

Слайд 9





Индивидуальные сравнения. Контрасты
Контраст – это комбинация средних генеральной совокупности вида                         , ему соответствует выборочный контраст
При этом сумма коэффициентов a равна 0: 
В ANOVA контраст – это линейная комбинация независимых нормально распределенных величин, таким образом, он имеет нормальное распределение
Стандартная ошибка выборочного контраста:
Тест                        и доверительный интервал
– уже знакомые нам из предыдущих семинаров, где используем распределение t(DFE)
Описание слайда:
Индивидуальные сравнения. Контрасты Контраст – это комбинация средних генеральной совокупности вида , ему соответствует выборочный контраст При этом сумма коэффициентов a равна 0: В ANOVA контраст – это линейная комбинация независимых нормально распределенных величин, таким образом, он имеет нормальное распределение Стандартная ошибка выборочного контраста: Тест и доверительный интервал – уже знакомые нам из предыдущих семинаров, где используем распределение t(DFE)

Слайд 10





Пример расчета контрастов
Посчитаем значимость различия средних
 А-С в нашем примере. Контраст: 
 ; ; 
Теперь посчитаем, отличается ли среднее С от среднего средних A-B:
Контраст: 
 ; 
Контрасты можно использовать, даже если общий F-тест не значимый, т.к. в некоторых случаях контрасты мощнее
Нельзя определять индивидуальные сравнения, глядя на данные! Такие сравнения планируются изначально (устранение ошибки III рода)
Описание слайда:
Пример расчета контрастов Посчитаем значимость различия средних А-С в нашем примере. Контраст: ; ; Теперь посчитаем, отличается ли среднее С от среднего средних A-B: Контраст: ; Контрасты можно использовать, даже если общий F-тест не значимый, т.к. в некоторых случаях контрасты мощнее Нельзя определять индивидуальные сравнения, глядя на данные! Такие сравнения планируются изначально (устранение ошибки III рода)

Слайд 11





Множественные сравнения
Используются только после отвержения H0 при помощи F-теста!
Тесты множественных сравнений представляют из себя парные t-тесты с использованием объединенной оценки дисперсии  из ANOVA : 
Метод подбора         зависит от используемой процедуры сравнения
Тест НСР (Fisher’s LSD) не использует поправку на множественные сравнения, и поэтому не является корректным
Простейшее решение – использовать поправку Бонферрони
Огромное количество поправок на любой вкус!
Описание слайда:
Множественные сравнения Используются только после отвержения H0 при помощи F-теста! Тесты множественных сравнений представляют из себя парные t-тесты с использованием объединенной оценки дисперсии из ANOVA : Метод подбора зависит от используемой процедуры сравнения Тест НСР (Fisher’s LSD) не использует поправку на множественные сравнения, и поэтому не является корректным Простейшее решение – использовать поправку Бонферрони Огромное количество поправок на любой вкус!

Слайд 12





Что делать, если допущения нарушаются
Если распределения остаются предположительно нормально распределенными, но дисперсия в группах гетерогенна
Если наибольшее и наименьшее стандартные отклонения различаются менее чем в 2 раза, то можно ничего не делать
Если различия дисперсий резкие, рекомендуется использовать F-тест Уэлча для разных дисперсий
Далее для множественных сравнений можно применить тест Геймса-Хоуэлла (Games-Howell test) 
Эти методы менее мощные, чем классические, однако применимы даже при очень малых выборках
Описание слайда:
Что делать, если допущения нарушаются Если распределения остаются предположительно нормально распределенными, но дисперсия в группах гетерогенна Если наибольшее и наименьшее стандартные отклонения различаются менее чем в 2 раза, то можно ничего не делать Если различия дисперсий резкие, рекомендуется использовать F-тест Уэлча для разных дисперсий Далее для множественных сравнений можно применить тест Геймса-Хоуэлла (Games-Howell test) Эти методы менее мощные, чем классические, однако применимы даже при очень малых выборках

Слайд 13





Ранговый ANOVA
Если резко нарушаются допущения, можно обратиться к непараметрическим методам оценки
Самый неприятный случай – когда возможны резкие выбросы, которые нельзя объяснить и убрать
Простые и примитивные непараметрические тесты – ранговые 
На предыдущих семинарах мы рассматривали ранговые корреляции Спирмена и тесты попарных сравнений Уилкоксона
Дисперсионный анализ также можно произвести ранговыми методами. В этом случае мы тестируем общую нулевую гипотезу не F-тестом, а тестом Крускала-Уоллиса (Kruskal-Wallis test)
Описание слайда:
Ранговый ANOVA Если резко нарушаются допущения, можно обратиться к непараметрическим методам оценки Самый неприятный случай – когда возможны резкие выбросы, которые нельзя объяснить и убрать Простые и примитивные непараметрические тесты – ранговые На предыдущих семинарах мы рассматривали ранговые корреляции Спирмена и тесты попарных сравнений Уилкоксона Дисперсионный анализ также можно произвести ранговыми методами. В этом случае мы тестируем общую нулевую гипотезу не F-тестом, а тестом Крускала-Уоллиса (Kruskal-Wallis test)

Слайд 14





Тест Крускала-Уоллиса
Проранжируем все наблюдения (общее ранжирование), рассчитаем суммы рангов  в i группах объемом n и общим количеством наблдений N:
H статистика Крускала-Уоллиса имеет вид: 
Когда объемы выборок большие и во всех группах примерно одинаковое распределение, H – статистика распределяется в соответствии с 
В большинстве случаев (но не всегда) асимптотический H тест дает надежные результаты и при малых выборках
Описание слайда:
Тест Крускала-Уоллиса Проранжируем все наблюдения (общее ранжирование), рассчитаем суммы рангов в i группах объемом n и общим количеством наблдений N: H статистика Крускала-Уоллиса имеет вид: Когда объемы выборок большие и во всех группах примерно одинаковое распределение, H – статистика распределяется в соответствии с В большинстве случаев (но не всегда) асимптотический H тест дает надежные результаты и при малых выборках

Слайд 15





Тест Крускала-Уоллиса
Рассмотрим урожаи культуры при разном количестве сорняков:
Графики нормальных квантилей по группам:
Описание слайда:
Тест Крускала-Уоллиса Рассмотрим урожаи культуры при разном количестве сорняков: Графики нормальных квантилей по группам:

Слайд 16





Тест Крускала-Уоллиса
Ранги наблюдений и суммы рангов по группам
Статистика Крускала-Уоллиса
Описание слайда:
Тест Крускала-Уоллиса Ранги наблюдений и суммы рангов по группам Статистика Крускала-Уоллиса

Слайд 17





Многофакторный дисперсионный анализ
Как и регрессия, дисперсионный анализ может быть многофакторным
Кроме того, существуют различные модификации регрессии и дисперсионного анализа, входящие в класс общих линейных моделей (GLM)
Многофакторный анализ мощнее, чем однофакторный по каждому фактору
Особый интерес представляет возможность нахождения и тестирование значимости взаимодействия между факторами
Описание слайда:
Многофакторный дисперсионный анализ Как и регрессия, дисперсионный анализ может быть многофакторным Кроме того, существуют различные модификации регрессии и дисперсионного анализа, входящие в класс общих линейных моделей (GLM) Многофакторный анализ мощнее, чем однофакторный по каждому фактору Особый интерес представляет возможность нахождения и тестирование значимости взаимодействия между факторами



Похожие презентации
Mypresentation.ru
Загрузить презентацию