🗊Презентация Проверка статистических гипотез. Версия 2

Категория: Математика
Нажмите для полного просмотра!
Проверка статистических гипотез. Версия 2, слайд №1Проверка статистических гипотез. Версия 2, слайд №2Проверка статистических гипотез. Версия 2, слайд №3Проверка статистических гипотез. Версия 2, слайд №4Проверка статистических гипотез. Версия 2, слайд №5Проверка статистических гипотез. Версия 2, слайд №6Проверка статистических гипотез. Версия 2, слайд №7Проверка статистических гипотез. Версия 2, слайд №8Проверка статистических гипотез. Версия 2, слайд №9Проверка статистических гипотез. Версия 2, слайд №10Проверка статистических гипотез. Версия 2, слайд №11Проверка статистических гипотез. Версия 2, слайд №12Проверка статистических гипотез. Версия 2, слайд №13Проверка статистических гипотез. Версия 2, слайд №14Проверка статистических гипотез. Версия 2, слайд №15Проверка статистических гипотез. Версия 2, слайд №16Проверка статистических гипотез. Версия 2, слайд №17Проверка статистических гипотез. Версия 2, слайд №18Проверка статистических гипотез. Версия 2, слайд №19Проверка статистических гипотез. Версия 2, слайд №20Проверка статистических гипотез. Версия 2, слайд №21Проверка статистических гипотез. Версия 2, слайд №22Проверка статистических гипотез. Версия 2, слайд №23Проверка статистических гипотез. Версия 2, слайд №24Проверка статистических гипотез. Версия 2, слайд №25Проверка статистических гипотез. Версия 2, слайд №26Проверка статистических гипотез. Версия 2, слайд №27Проверка статистических гипотез. Версия 2, слайд №28Проверка статистических гипотез. Версия 2, слайд №29Проверка статистических гипотез. Версия 2, слайд №30Проверка статистических гипотез. Версия 2, слайд №31Проверка статистических гипотез. Версия 2, слайд №32Проверка статистических гипотез. Версия 2, слайд №33Проверка статистических гипотез. Версия 2, слайд №34Проверка статистических гипотез. Версия 2, слайд №35Проверка статистических гипотез. Версия 2, слайд №36Проверка статистических гипотез. Версия 2, слайд №37Проверка статистических гипотез. Версия 2, слайд №38Проверка статистических гипотез. Версия 2, слайд №39Проверка статистических гипотез. Версия 2, слайд №40Проверка статистических гипотез. Версия 2, слайд №41Проверка статистических гипотез. Версия 2, слайд №42Проверка статистических гипотез. Версия 2, слайд №43Проверка статистических гипотез. Версия 2, слайд №44Проверка статистических гипотез. Версия 2, слайд №45Проверка статистических гипотез. Версия 2, слайд №46Проверка статистических гипотез. Версия 2, слайд №47Проверка статистических гипотез. Версия 2, слайд №48Проверка статистических гипотез. Версия 2, слайд №49Проверка статистических гипотез. Версия 2, слайд №50Проверка статистических гипотез. Версия 2, слайд №51Проверка статистических гипотез. Версия 2, слайд №52Проверка статистических гипотез. Версия 2, слайд №53Проверка статистических гипотез. Версия 2, слайд №54Проверка статистических гипотез. Версия 2, слайд №55Проверка статистических гипотез. Версия 2, слайд №56Проверка статистических гипотез. Версия 2, слайд №57Проверка статистических гипотез. Версия 2, слайд №58Проверка статистических гипотез. Версия 2, слайд №59Проверка статистических гипотез. Версия 2, слайд №60Проверка статистических гипотез. Версия 2, слайд №61Проверка статистических гипотез. Версия 2, слайд №62Проверка статистических гипотез. Версия 2, слайд №63Проверка статистических гипотез. Версия 2, слайд №64Проверка статистических гипотез. Версия 2, слайд №65Проверка статистических гипотез. Версия 2, слайд №66Проверка статистических гипотез. Версия 2, слайд №67Проверка статистических гипотез. Версия 2, слайд №68Проверка статистических гипотез. Версия 2, слайд №69Проверка статистических гипотез. Версия 2, слайд №70Проверка статистических гипотез. Версия 2, слайд №71Проверка статистических гипотез. Версия 2, слайд №72Проверка статистических гипотез. Версия 2, слайд №73Проверка статистических гипотез. Версия 2, слайд №74Проверка статистических гипотез. Версия 2, слайд №75Проверка статистических гипотез. Версия 2, слайд №76Проверка статистических гипотез. Версия 2, слайд №77Проверка статистических гипотез. Версия 2, слайд №78Проверка статистических гипотез. Версия 2, слайд №79Проверка статистических гипотез. Версия 2, слайд №80Проверка статистических гипотез. Версия 2, слайд №81Проверка статистических гипотез. Версия 2, слайд №82Проверка статистических гипотез. Версия 2, слайд №83Проверка статистических гипотез. Версия 2, слайд №84Проверка статистических гипотез. Версия 2, слайд №85Проверка статистических гипотез. Версия 2, слайд №86Проверка статистических гипотез. Версия 2, слайд №87Проверка статистических гипотез. Версия 2, слайд №88Проверка статистических гипотез. Версия 2, слайд №89Проверка статистических гипотез. Версия 2, слайд №90Проверка статистических гипотез. Версия 2, слайд №91Проверка статистических гипотез. Версия 2, слайд №92Проверка статистических гипотез. Версия 2, слайд №93Проверка статистических гипотез. Версия 2, слайд №94Проверка статистических гипотез. Версия 2, слайд №95Проверка статистических гипотез. Версия 2, слайд №96Проверка статистических гипотез. Версия 2, слайд №97Проверка статистических гипотез. Версия 2, слайд №98Проверка статистических гипотез. Версия 2, слайд №99Проверка статистических гипотез. Версия 2, слайд №100Проверка статистических гипотез. Версия 2, слайд №101Проверка статистических гипотез. Версия 2, слайд №102Проверка статистических гипотез. Версия 2, слайд №103Проверка статистических гипотез. Версия 2, слайд №104Проверка статистических гипотез. Версия 2, слайд №105Проверка статистических гипотез. Версия 2, слайд №106Проверка статистических гипотез. Версия 2, слайд №107Проверка статистических гипотез. Версия 2, слайд №108Проверка статистических гипотез. Версия 2, слайд №109Проверка статистических гипотез. Версия 2, слайд №110Проверка статистических гипотез. Версия 2, слайд №111Проверка статистических гипотез. Версия 2, слайд №112Проверка статистических гипотез. Версия 2, слайд №113Проверка статистических гипотез. Версия 2, слайд №114Проверка статистических гипотез. Версия 2, слайд №115Проверка статистических гипотез. Версия 2, слайд №116Проверка статистических гипотез. Версия 2, слайд №117Проверка статистических гипотез. Версия 2, слайд №118Проверка статистических гипотез. Версия 2, слайд №119Проверка статистических гипотез. Версия 2, слайд №120Проверка статистических гипотез. Версия 2, слайд №121Проверка статистических гипотез. Версия 2, слайд №122Проверка статистических гипотез. Версия 2, слайд №123Проверка статистических гипотез. Версия 2, слайд №124Проверка статистических гипотез. Версия 2, слайд №125Проверка статистических гипотез. Версия 2, слайд №126Проверка статистических гипотез. Версия 2, слайд №127Проверка статистических гипотез. Версия 2, слайд №128Проверка статистических гипотез. Версия 2, слайд №129Проверка статистических гипотез. Версия 2, слайд №130Проверка статистических гипотез. Версия 2, слайд №131Проверка статистических гипотез. Версия 2, слайд №132Проверка статистических гипотез. Версия 2, слайд №133Проверка статистических гипотез. Версия 2, слайд №134Проверка статистических гипотез. Версия 2, слайд №135Проверка статистических гипотез. Версия 2, слайд №136Проверка статистических гипотез. Версия 2, слайд №137Проверка статистических гипотез. Версия 2, слайд №138Проверка статистических гипотез. Версия 2, слайд №139Проверка статистических гипотез. Версия 2, слайд №140Проверка статистических гипотез. Версия 2, слайд №141Проверка статистических гипотез. Версия 2, слайд №142Проверка статистических гипотез. Версия 2, слайд №143Проверка статистических гипотез. Версия 2, слайд №144Проверка статистических гипотез. Версия 2, слайд №145Проверка статистических гипотез. Версия 2, слайд №146Проверка статистических гипотез. Версия 2, слайд №147Проверка статистических гипотез. Версия 2, слайд №148Проверка статистических гипотез. Версия 2, слайд №149Проверка статистических гипотез. Версия 2, слайд №150Проверка статистических гипотез. Версия 2, слайд №151Проверка статистических гипотез. Версия 2, слайд №152Проверка статистических гипотез. Версия 2, слайд №153Проверка статистических гипотез. Версия 2, слайд №154Проверка статистических гипотез. Версия 2, слайд №155Проверка статистических гипотез. Версия 2, слайд №156Проверка статистических гипотез. Версия 2, слайд №157Проверка статистических гипотез. Версия 2, слайд №158Проверка статистических гипотез. Версия 2, слайд №159Проверка статистических гипотез. Версия 2, слайд №160Проверка статистических гипотез. Версия 2, слайд №161Проверка статистических гипотез. Версия 2, слайд №162Проверка статистических гипотез. Версия 2, слайд №163Проверка статистических гипотез. Версия 2, слайд №164Проверка статистических гипотез. Версия 2, слайд №165Проверка статистических гипотез. Версия 2, слайд №166Проверка статистических гипотез. Версия 2, слайд №167Проверка статистических гипотез. Версия 2, слайд №168Проверка статистических гипотез. Версия 2, слайд №169Проверка статистических гипотез. Версия 2, слайд №170Проверка статистических гипотез. Версия 2, слайд №171

Содержание

Вы можете ознакомиться и скачать презентацию на тему Проверка статистических гипотез. Версия 2. Доклад-сообщение содержит 171 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Проверка статистических гипотез
Версия 2
Описание слайда:
Проверка статистических гипотез Версия 2

Слайд 2





Определение 
Статистическая гипотеза – утверждение о свойствах распределения вероятностей случайной величины (или случайного вектора).
Гипотеза нуждается в проверке.
Проверка основывается на результатах эксперимента, на наблюдениях.
Описание слайда:
Определение Статистическая гипотеза – утверждение о свойствах распределения вероятностей случайной величины (или случайного вектора). Гипотеза нуждается в проверке. Проверка основывается на результатах эксперимента, на наблюдениях.

Слайд 3





Напоминание
Что такое функция распределения?
Что такое плотность распределения?
Описание слайда:
Напоминание Что такое функция распределения? Что такое плотность распределения?

Слайд 4






Раздел 1
Зачем проверяют 
статистические гипотезы
Обсудим наиболее важные статистические гипотезы.
Описание слайда:
Раздел 1 Зачем проверяют статистические гипотезы Обсудим наиболее важные статистические гипотезы.

Слайд 5





1.  Гипотеза согласия.
Обозначим           функцию распределения случайной величины Х. 
Пусть           - некоторая заданная функция распределения.
Гипотеза : функции распределения совпадают, то есть         = 
Кому и когда приходится проверять гипотезу согласия?
Описание слайда:
1. Гипотеза согласия. Обозначим функцию распределения случайной величины Х. Пусть - некоторая заданная функция распределения. Гипотеза : функции распределения совпадают, то есть = Кому и когда приходится проверять гипотезу согласия?

Слайд 6





Пример гипотезы согласия
Гипотеза о нормальности распределения
В этом случае
Описание слайда:
Пример гипотезы согласия Гипотеза о нормальности распределения В этом случае

Слайд 7


Проверка статистических гипотез. Версия 2, слайд №7
Описание слайда:

Слайд 8





Почему гипотеза нормальности  важна?
1.  Нормальное распределение часто встречается 
		(вспомним центральную предельную теорему).
Описание слайда:
Почему гипотеза нормальности важна? 1. Нормальное распределение часто встречается (вспомним центральную предельную теорему).

Слайд 9





Почему гипотеза нормальности  важна?
2.  Когда распределение нормальное, экономим деньги: если
 А) распределение можно считать нормальным и  
 Б) задана необходимая погрешность результата,
   то при проведении анализа можно обойтись меньшим числом наблюдений.
Например, опросить меньше покупателей.
Описание слайда:
Почему гипотеза нормальности важна? 2. Когда распределение нормальное, экономим деньги: если А) распределение можно считать нормальным и Б) задана необходимая погрешность результата, то при проведении анализа можно обойтись меньшим числом наблюдений. Например, опросить меньше покупателей.

Слайд 10





Пример гипотезы согласия 2
Гипотеза об экспоненциальности распределения.
В этом случае функция распределения
Описание слайда:
Пример гипотезы согласия 2 Гипотеза об экспоненциальности распределения. В этом случае функция распределения

Слайд 11





Почему важна гипотеза экспоненциальности?
Экспоненциальное распределение часто встречается, когда изучается «время ожидания».
Описание слайда:
Почему важна гипотеза экспоненциальности? Экспоненциальное распределение часто встречается, когда изучается «время ожидания».

Слайд 12





Например,
Время до аварии (нужно для расчета страховой премии).
Время обслуживания покупателя кассиром (нужно для определения числа касс в супермаркете).
Время до поломки изделия (нужно для планирования расходов на гарантийный ремонт).
Описание слайда:
Например, Время до аварии (нужно для расчета страховой премии). Время обслуживания покупателя кассиром (нужно для определения числа касс в супермаркете). Время до поломки изделия (нужно для планирования расходов на гарантийный ремонт).

Слайд 13





2.  Гипотеза однородности.
Обозначим           функцию распределения случайной величины Х. 
Обозначим            функцию распределения случайной величины Y
Гипотеза : функции распределения совпадают  
Кому и когда приходится проверять гипотезу согласия?
Описание слайда:
2. Гипотеза однородности. Обозначим функцию распределения случайной величины Х. Обозначим функцию распределения случайной величины Y Гипотеза : функции распределения совпадают Кому и когда приходится проверять гипотезу согласия?

Слайд 14





Например,

Распределение продаж до рекламной акции и после нее.
Если распределение продаж не изменилось, то улучшения нет.
Может сравниваться распределение покупателей по возрасту. Например, если реклама была нацелена на конкретный сегмент, например, на молодых мам.
Описание слайда:
Например, Распределение продаж до рекламной акции и после нее. Если распределение продаж не изменилось, то улучшения нет. Может сравниваться распределение покупателей по возрасту. Например, если реклама была нацелена на конкретный сегмент, например, на молодых мам.

Слайд 15





 3.  Гипотеза независимости.
Гипотеза : случайные величины X и Y независимы  
Кому и когда приходится проверять гипотезу независимости?
Описание слайда:
3. Гипотеза независимости. Гипотеза : случайные величины X и Y независимы Кому и когда приходится проверять гипотезу независимости?

Слайд 16





Например,
Если возраст покупателей и объем покупки зависимы, то возраст надо учитывать при сегментации покупателей.
Иногда зависимость бывает неочевидной.
Длина волос и рост людей – зависимые переменные.
Описание слайда:
Например, Если возраст покупателей и объем покупки зависимы, то возраст надо учитывать при сегментации покупателей. Иногда зависимость бывает неочевидной. Длина волос и рост людей – зависимые переменные.

Слайд 17





Вопрос:
наличие балкона влияет на цену квартиры?
Описание слайда:
Вопрос: наличие балкона влияет на цену квартиры?

Слайд 18





На шаг дальше…
В эконометрике редко интересен сам факт зависимости. Обычно идут дальше, пытаются описать зависимость.
Подобные задачи решаются, в частности, методами регрессионного анализа.
Регрессионный анализ – сдедующая тема.
Описание слайда:
На шаг дальше… В эконометрике редко интересен сам факт зависимости. Обычно идут дальше, пытаются описать зависимость. Подобные задачи решаются, в частности, методами регрессионного анализа. Регрессионный анализ – сдедующая тема.

Слайд 19





4.  Гипотезы о параметре распределения.
Очень часто не так важно распределение случайной величины. Интересна лишь одна характеристика распределения.
Описание слайда:
4. Гипотезы о параметре распределения. Очень часто не так важно распределение случайной величины. Интересна лишь одна характеристика распределения.

Слайд 20





Если анализируются продажи магазина, то в первую очередь интересно… 

Математическое ожидание
Так как математическое ожидание – вероятностная модель для среднего значения.
В данном случае для средних продаж.
Описание слайда:
Если анализируются продажи магазина, то в первую очередь интересно… Математическое ожидание Так как математическое ожидание – вероятностная модель для среднего значения. В данном случае для средних продаж.

Слайд 21






Гипотеза. Математические ожидания случайных величин X и Y одинаковы.
EX = EY
Описание слайда:
Гипотеза. Математические ожидания случайных величин X и Y одинаковы. EX = EY

Слайд 22





Если сравниваются медианы:
Гипотеза. Медианы случайных величин X и Y одинаковы.
   Med(X) = med(Y)
Описание слайда:
Если сравниваются медианы: Гипотеза. Медианы случайных величин X и Y одинаковы. Med(X) = med(Y)

Слайд 23





Основные условия применения статистических тестов
Вопрос должен касаться какой-либо характеристики массового явления. 
Характеристика меняется случайным образом от наблюдения к наблюдению. 
Вопрос должен быть относительно простым и четко сформулированным
Описание слайда:
Основные условия применения статистических тестов Вопрос должен касаться какой-либо характеристики массового явления. Характеристика меняется случайным образом от наблюдения к наблюдению. Вопрос должен быть относительно простым и четко сформулированным

Слайд 24





Пример 1
В обычных условиях зафиксирован некоторый уровень продаж. Затем была проведена рекламная акция.
Руководству фирмы надо оценить результат. 
Для этого нужно выяснить, было ли существенное увеличение продаж. В частности, окупились ли затраты на рекламу.
Описание слайда:
Пример 1 В обычных условиях зафиксирован некоторый уровень продаж. Затем была проведена рекламная акция. Руководству фирмы надо оценить результат. Для этого нужно выяснить, было ли существенное увеличение продаж. В частности, окупились ли затраты на рекламу.

Слайд 25





Основная проблема:
Увеличение продаж могло быть вызвано случайными факторами. 
Продажи все время меняются, случайным образом отклоняются от заданного значения.
Статистически значимое отклонение должно превышать эти случайные отклонения.
Описание слайда:
Основная проблема: Увеличение продаж могло быть вызвано случайными факторами. Продажи все время меняются, случайным образом отклоняются от заданного значения. Статистически значимое отклонение должно превышать эти случайные отклонения.

Слайд 26





Пример 2
Разработан новый варианта упаковки товара. 
Требуется проверить предположение, что товар в новой упаковке имеет в данном регионе больший уровень продаж, чем вариант в старой упаковке.
Описание слайда:
Пример 2 Разработан новый варианта упаковки товара. Требуется проверить предположение, что товар в новой упаковке имеет в данном регионе больший уровень продаж, чем вариант в старой упаковке.

Слайд 27





Пример 3
Верно ли, что основной конкурент действует на том же сегменте рынка, что и фирма «Х»? 
При ответе на этот вопрос может потребоваться проверить, одинаково ли распределение по возрасту у покупателей товаров фирмы «Х» и ее основного конкурента.
Описание слайда:
Пример 3 Верно ли, что основной конкурент действует на том же сегменте рынка, что и фирма «Х»? При ответе на этот вопрос может потребоваться проверить, одинаково ли распределение по возрасту у покупателей товаров фирмы «Х» и ее основного конкурента.

Слайд 28





Пример 4
Фирма изучает постоянных покупателей своей продукции, чтобы увеличить их лояльность и количество. 
В рамках этой задачи аналитик проверяет, зависит ли лояльность потребителя от его пола, возраста, уровня образования.
Описание слайда:
Пример 4 Фирма изучает постоянных покупателей своей продукции, чтобы увеличить их лояльность и количество. В рамках этой задачи аналитик проверяет, зависит ли лояльность потребителя от его пола, возраста, уровня образования.

Слайд 29





Пример 4. Часть 2
Статистическая формулировка: проверить гипотезы о независимости уровня лояльности и 
а) пола покупателя; 
б) возраста покупателя; 
в)  уровня образования покупателя.
Далее, можно проверить, различаются ли средние значения изучаемых показателей у лояльных и не лояльных покупателей.
Описание слайда:
Пример 4. Часть 2 Статистическая формулировка: проверить гипотезы о независимости уровня лояльности и а) пола покупателя; б) возраста покупателя; в) уровня образования покупателя. Далее, можно проверить, различаются ли средние значения изучаемых показателей у лояльных и не лояльных покупателей.

Слайд 30






Раздел 2
Технологии проверки статистических гипотез
Основные понятия
Описание слайда:
Раздел 2 Технологии проверки статистических гипотез Основные понятия

Слайд 31





Выбираем из двух гипотез! 
Гипотеза принимается или отвергается
Так неудобно
Надо: выбираем между двумя статистическими гипотезами.
Описание слайда:
Выбираем из двух гипотез! Гипотеза принимается или отвергается Так неудобно Надо: выбираем между двумя статистическими гипотезами.

Слайд 32





Определение
Проверку гипотез на основе выборочных статистических данных называют статистической проверкой гипотез.
Описание слайда:
Определение Проверку гипотез на основе выборочных статистических данных называют статистической проверкой гипотез.

Слайд 33





Основная и альтернативная гипотезы
Одну из гипотез называют основной и обозначают, как правило, Н, а другую — альтернативной (конкурирующей) и обозначают К.
Если не уточняется, о какой гипотеза идет речь, то имеется в виду основная гипотеза.
Чаще всего (но не всегда) одна гипотеза утверждает, что предположение верно, другая – что нет.
Описание слайда:
Основная и альтернативная гипотезы Одну из гипотез называют основной и обозначают, как правило, Н, а другую — альтернативной (конкурирующей) и обозначают К. Если не уточняется, о какой гипотеза идет речь, то имеется в виду основная гипотеза. Чаще всего (но не всегда) одна гипотеза утверждает, что предположение верно, другая – что нет.

Слайд 34






Неточно говорить «…выбрана основная гипотеза…» или «…выбрана альтернативная гипотеза…», 
Неточно говорить 
«…основная гипотеза принята…» или «основная гипотеза отвергнута…».
Описание слайда:
Неточно говорить «…выбрана основная гипотеза…» или «…выбрана альтернативная гипотеза…», Неточно говорить «…основная гипотеза принята…» или «основная гипотеза отвергнута…».

Слайд 35





Важное уточнение. 
Правильно говорить 
«основная гипотеза отвергнута…» и 
«основная гипотеза не отвергнута…».
Так как обычно проверяют лишь достаточное условие.
Описание слайда:
Важное уточнение. Правильно говорить «основная гипотеза отвергнута…» и «основная гипотеза не отвергнута…». Так как обычно проверяют лишь достаточное условие.

Слайд 36





Комментарий 1:
Гипотеза: число делится на 6 нацело.
Фактически проверяем, делится ли число на 2 нацело.
Описание слайда:
Комментарий 1: Гипотеза: число делится на 6 нацело. Фактически проверяем, делится ли число на 2 нацело.

Слайд 37





Комментарий 2:

Часто случается, что у аналитика недостаточно данных, чтобы проявился изучаемый эффект. 
Например, 
фармацевтическая компания выпускает лекарство, аналогичное уже существующему, так называемый "дженерик" (generic) вместо оригинального, производимого разработчиком ("brand-named"). 
Компания проводит исследование, проверяющее, что лекарство-аналог эквивалентно уже существующему.
Описание слайда:
Комментарий 2: Часто случается, что у аналитика недостаточно данных, чтобы проявился изучаемый эффект. Например, фармацевтическая компания выпускает лекарство, аналогичное уже существующему, так называемый "дженерик" (generic) вместо оригинального, производимого разработчиком ("brand-named"). Компания проводит исследование, проверяющее, что лекарство-аналог эквивалентно уже существующему.

Слайд 38





Отвергнуть гипотезу недостаточно
Основная гипотеза при анализе: отличия между лекарствами нет. 
Дело касается здоровья людей, и не отвергнуть гипотезу недостаточно. 
Необходимы более жесткие требования к процедуре. Надо проверить еще и побочные эффекты у лиц страдающих заболеванием «х1», «х2», и так далее…
Описание слайда:
Отвергнуть гипотезу недостаточно Основная гипотеза при анализе: отличия между лекарствами нет. Дело касается здоровья людей, и не отвергнуть гипотезу недостаточно. Необходимы более жесткие требования к процедуре. Надо проверить еще и побочные эффекты у лиц страдающих заболеванием «х1», «х2», и так далее…

Слайд 39





Вывод
Хотя часто можно услышать, что (основная) гипотеза принята, такое выражение неточно. 
Точнее говорить, что (основная) гипотеза не отвергнута
Описание слайда:
Вывод Хотя часто можно услышать, что (основная) гипотеза принята, такое выражение неточно. Точнее говорить, что (основная) гипотеза не отвергнута

Слайд 40





Ошибки первого и второго рода
Ошибка первого рода состоит в том, что отвергается основная гипотеза, когда на самом деле она верна. 
Ошибка второго рода состоит в том, что отвергается конкурирующая гипотеза, когда она верна.
Описание слайда:
Ошибки первого и второго рода Ошибка первого рода состоит в том, что отвергается основная гипотеза, когда на самом деле она верна. Ошибка второго рода состоит в том, что отвергается конкурирующая гипотеза, когда она верна.

Слайд 41





Аналогия
В больнице врач принимает решение, направлять пациента на операцию, или нет.
Описание слайда:
Аналогия В больнице врач принимает решение, направлять пациента на операцию, или нет.

Слайд 42






Когда врач делает ошибку первого рода? 
Когда врач делает ошибку второго рода?
Описание слайда:
Когда врач делает ошибку первого рода? Когда врач делает ошибку второго рода?

Слайд 43





Гипотеза: нужна срочная операция
Описание слайда:
Гипотеза: нужна срочная операция

Слайд 44






Может ли врач свести частоту (вероятность) ошибок первого рода к нулю? 
Может ли врач свести частоту (вероятность) ошибок второго рода к нулю?
Описание слайда:
Может ли врач свести частоту (вероятность) ошибок первого рода к нулю? Может ли врач свести частоту (вероятность) ошибок второго рода к нулю?

Слайд 45





Есть исключения
Например, 
если мы будем вакцинацию считать операцией, 
то получается, что врачи предпочитают делать маленькую "превентивную" операцию всем, чтобы исключить ошибки первого рода.
Описание слайда:
Есть исключения Например, если мы будем вакцинацию считать операцией, то получается, что врачи предпочитают делать маленькую "превентивную" операцию всем, чтобы исключить ошибки первого рода.

Слайд 46





Последствия ошибок могут быть различными
Ошибка первого рода (обычно) опаснее, но полностью избежать ее не удастся.
При проверке статистических гипотез исходят именно из этой предпосылки
Описание слайда:
Последствия ошибок могут быть различными Ошибка первого рода (обычно) опаснее, но полностью избежать ее не удастся. При проверке статистических гипотез исходят именно из этой предпосылки

Слайд 47





Уровень значимости 
Долю ошибок первого рода ограничивают сверху числом, называемым уровень значимости. 
Исторически сложилось так, что в качестве уровня значимости чаще всего выбирают одно из чисел 0.005, 0.01, 0.05. 
То есть аналитик допускает, что (в среднем) одна проверка из 200, 100, 20 будет давать неверный результат.
Описание слайда:
Уровень значимости Долю ошибок первого рода ограничивают сверху числом, называемым уровень значимости. Исторически сложилось так, что в качестве уровня значимости чаще всего выбирают одно из чисел 0.005, 0.01, 0.05. То есть аналитик допускает, что (в среднем) одна проверка из 200, 100, 20 будет давать неверный результат.

Слайд 48





Для новичков!
Чаще всего уровень значимости равен 0,05
На самом деле выбор уровня значимости – большая проблема! Зависит, например, от числа наблюдений!
Смотрите литературу
Описание слайда:
Для новичков! Чаще всего уровень значимости равен 0,05 На самом деле выбор уровня значимости – большая проблема! Зависит, например, от числа наблюдений! Смотрите литературу

Слайд 49






«медицинский» пример 
На что влияет выбор уровня значимости?
Проектирование атомной электростанции
Трелевочный трактор
Описание слайда:
«медицинский» пример На что влияет выбор уровня значимости? Проектирование атомной электростанции Трелевочный трактор

Слайд 50





Ошибка второго рода и мощность
Как добиться того, чтобы вероятность ошибки второго рода была малой?
Очень сложно.
Состоятельные критерии.
Ошибку можно уменьшить, если увеличить число анализируемых наблюдений. 
 Необходимы большие выборки.
Описание слайда:
Ошибка второго рода и мощность Как добиться того, чтобы вероятность ошибки второго рода была малой? Очень сложно. Состоятельные критерии. Ошибку можно уменьшить, если увеличить число анализируемых наблюдений. Необходимы большие выборки.

Слайд 51





Дополнительно
Если выборка маленькая (часто границей между большой и маленькой выборкой рекомендуют считать 30 наблюдений), проверить гипотезу по малой выборке удастся. 
Но
Платой за малый размер будет неприемлемо большая вероятность ошибки второго рода. 
Большинство практиков игнорируют ошибку второго рода.
Это неверно.
Профессиональные статистики в таких ситуациях часто увеличивают уровень значимости (например до 0.15 или 0.2), чтобы сделать вероятности ошибок сопоставимыми.
Описание слайда:
Дополнительно Если выборка маленькая (часто границей между большой и маленькой выборкой рекомендуют считать 30 наблюдений), проверить гипотезу по малой выборке удастся. Но Платой за малый размер будет неприемлемо большая вероятность ошибки второго рода. Большинство практиков игнорируют ошибку второго рода. Это неверно. Профессиональные статистики в таких ситуациях часто увеличивают уровень значимости (например до 0.15 или 0.2), чтобы сделать вероятности ошибок сопоставимыми.

Слайд 52





Задача.
 Вместо врача рассмотрим банковского служащего, принимающего решение, выдавать заем или нет. 
Как будут интерпретироваться статистические понятия в этом случае?
Описание слайда:
Задача. Вместо врача рассмотрим банковского служащего, принимающего решение, выдавать заем или нет. Как будут интерпретироваться статистические понятия в этом случае?

Слайд 53





Алгоритм проверки статистических гипотез 
1. Имеются n наблюдений , то есть n  чисел, полученных, например, в результате опроса. 
2. Заранее задан уровень значимости α. Обычно это одно из чисел 0.005, 0.01, 0.05.
Описание слайда:
Алгоритм проверки статистических гипотез 1. Имеются n наблюдений , то есть n чисел, полученных, например, в результате опроса. 2. Заранее задан уровень значимости α. Обычно это одно из чисел 0.005, 0.01, 0.05.

Слайд 54






3. Задан статистический критерий, то есть функция от наблюдений . 
4. Найдено p-значение (p-value). 
Иногда переводится как значимость (Significance).
Описание слайда:
3. Задан статистический критерий, то есть функция от наблюдений . 4. Найдено p-значение (p-value). Иногда переводится как значимость (Significance).

Слайд 55






5.  Проверяются все условия, при которых критерий будет работать.
Условия – Из учебника или справочника.
Несколько важных критериев будет рассмотрено далее
Описание слайда:
5. Проверяются все условия, при которых критерий будет работать. Условия – Из учебника или справочника. Несколько важных критериев будет рассмотрено далее

Слайд 56






6.  
Если p< α  - гипотезу отвергаем,   	если p> α  - не отвергаем. 
Напомним: 
α – уровень значимости
p -  p-value.
Описание слайда:
6. Если p< α - гипотезу отвергаем, если p> α - не отвергаем. Напомним: α – уровень значимости p - p-value.

Слайд 57





Комментарии 
Наблюдения  не обязательно являются числами.
 Выбор того статистического критерия, который подходит для задачи – важная и сложная задача
Описание слайда:
Комментарии Наблюдения не обязательно являются числами. Выбор того статистического критерия, который подходит для задачи – важная и сложная задача

Слайд 58





Проверка условий применимости
Например, для применения t – критерия Стьюдента или для проверка гипотезы независимости с помощью критерия Пирсона надо проверить близость распределения переменных к нормальному.
Описание слайда:
Проверка условий применимости Например, для применения t – критерия Стьюдента или для проверка гипотезы независимости с помощью критерия Пирсона надо проверить близость распределения переменных к нормальному.

Слайд 59





Статистика критерия или 
тестовая статистикой
Иногда используют статистику критерия или тестовую статистику. 
Изредка она важна сама по себе  (например, коэффициент корреляции), в таких конкретных случаях мы будем ее указывать.
Описание слайда:
Статистика критерия или тестовая статистикой Иногда используют статистику критерия или тестовую статистику. Изредка она важна сама по себе (например, коэффициент корреляции), в таких конкретных случаях мы будем ее указывать.

Слайд 60





Интерпретация статистики критерия
Значение статистики критерия (обычно) измеряет, насколько данные согласуются с гипотезой.
Описание слайда:
Интерпретация статистики критерия Значение статистики критерия (обычно) измеряет, насколько данные согласуются с гипотезой.

Слайд 61






"Маленькие" значения статистики критерия указывают, что  данные «ведут себя» в соответствии с гипотезой.
В этом случае гипотеза не отвергается.
Описание слайда:
"Маленькие" значения статистики критерия указывают, что данные «ведут себя» в соответствии с гипотезой. В этом случае гипотеза не отвергается.

Слайд 62






"Большие" значения статистики критерия указывают, что данные не соответствуют гипотезе, противоречат ей.
Гипотеза отвергается.
Описание слайда:
"Большие" значения статистики критерия указывают, что данные не соответствуют гипотезе, противоречат ей. Гипотеза отвергается.

Слайд 63





Пример 
Нормальное распределение с дисперсией 1
Имеется n наблюдений
Основная гипотеза: математическое ожидание равно 11
Альтернативная гипотеза: математическое ожидание равно 12
Описание слайда:
Пример Нормальное распределение с дисперсией 1 Имеется n наблюдений Основная гипотеза: математическое ожидание равно 11 Альтернативная гипотеза: математическое ожидание равно 12

Слайд 64





Напоминание из теории вероятностей
Среднее арифметическое n независимых одинаково распределенных случайных величин с общим нормальным распределением N(a, b) имеет нормальное распределение N(a, b/n)
Описание слайда:
Напоминание из теории вероятностей Среднее арифметическое n независимых одинаково распределенных случайных величин с общим нормальным распределением N(a, b) имеет нормальное распределение N(a, b/n)

Слайд 65





Вопрос:
Где на графике ошибка первого рода, где ошибка второго рода?
Описание слайда:
Вопрос: Где на графике ошибка первого рода, где ошибка второго рода?

Слайд 66





Интерпретация статистики критерия
В статистике существует традиция, что именно задавать в качестве основной гипотезы. 
Примеры.
Описание слайда:
Интерпретация статистики критерия В статистике существует традиция, что именно задавать в качестве основной гипотезы. Примеры.

Слайд 67






Раздел 3
                  Важные частные случаи
Описание слайда:
Раздел 3 Важные частные случаи

Слайд 68






Проверка гипотезы о нормальности распределения случайной величины
Описание слайда:
Проверка гипотезы о нормальности распределения случайной величины

Слайд 69





Статистическая формулировка
Гипотеза: Случайная величина имеет нормальное распределение, значения параметров распределения заранее не известны.
Конкурирующая гипотеза: Распределение случайной величины отличается от нормального.
Описание слайда:
Статистическая формулировка Гипотеза: Случайная величина имеет нормальное распределение, значения параметров распределения заранее не известны. Конкурирующая гипотеза: Распределение случайной величины отличается от нормального.

Слайд 70





Критерий Шапиро-Уилка
Критерий Шапиро-Уилка. 
shapiro.test(data)
От 3 до 5000 наблюдений
Описание слайда:
Критерий Шапиро-Уилка Критерий Шапиро-Уилка. shapiro.test(data) От 3 до 5000 наблюдений

Слайд 71





Package "nortest"
         Критерий  Anderson-Darling
library(nortest)
ad.test(data)
         Критерий Lilliefors (Kolmogorov-Smirnov)
library(nortest)
lillie.test(x)
Описание слайда:
Package "nortest" Критерий Anderson-Darling library(nortest) ad.test(data) Критерий Lilliefors (Kolmogorov-Smirnov) library(nortest) lillie.test(x)

Слайд 72





Число наблюдений
Если анализируется меньше 60 (2000) наблюдений, рекомендуется использовать критерий Шапиро-Уилка
если больше 60, то критерий Колмогорова-Смирнова.
Описание слайда:
Число наблюдений Если анализируется меньше 60 (2000) наблюдений, рекомендуется использовать критерий Шапиро-Уилка если больше 60, то критерий Колмогорова-Смирнова.

Слайд 73






А нужно ли проверять гипотезу нормальности?
Описание слайда:
А нужно ли проверять гипотезу нормальности?

Слайд 74






Как оказалось, для тех методов, которые рассматриваются в курсе, требование нормальности распределения можно заметно ослабить. 
Эти методы работают не только когда переменные имеют нормальное распределение, но и когда, как говорят, «распределение данных несущественно отличается от нормального».
Описание слайда:
Как оказалось, для тех методов, которые рассматриваются в курсе, требование нормальности распределения можно заметно ослабить. Эти методы работают не только когда переменные имеют нормальное распределение, но и когда, как говорят, «распределение данных несущественно отличается от нормального».

Слайд 75






допустим известно, что распределение случайной величины не нормальное. 
В каком случае отклонение от нормальности не существенное?
Описание слайда:
допустим известно, что распределение случайной величины не нормальное. В каком случае отклонение от нормальности не существенное?

Слайд 76





Итак,
гипотеза о нормальности распределения изучаемой переменной уже отвергнута.
Описание слайда:
Итак, гипотеза о нормальности распределения изучаемой переменной уже отвергнута.

Слайд 77





Существенные отклонения
1.  Наличие выбросов в данных. 
2.  Явная асимметрия гистограммы. 
3.  Очень сильное отклонение формы гистограммы от колоколообразной формы.
Описание слайда:
Существенные отклонения 1. Наличие выбросов в данных. 2. Явная асимметрия гистограммы. 3. Очень сильное отклонение формы гистограммы от колоколообразной формы.

Слайд 78





Рекомендуется
строго относиться к присутствию выбросов,
снисходительно к отклонениям от симметрии. 
Наше отношение к колоколообразной форме гистограммы зависит от числа наблюдений. Если имеется меньше 30 наблюдений, наше отношение в высшей степени либерально, если число наблюдений находится между 30 и 150, мы относимся к отклонениям снисходительно, если имеется больше 150 наблюдений – строго.
Описание слайда:
Рекомендуется строго относиться к присутствию выбросов, снисходительно к отклонениям от симметрии. Наше отношение к колоколообразной форме гистограммы зависит от числа наблюдений. Если имеется меньше 30 наблюдений, наше отношение в высшей степени либерально, если число наблюдений находится между 30 и 150, мы относимся к отклонениям снисходительно, если имеется больше 150 наблюдений – строго.

Слайд 79


Проверка статистических гипотез. Версия 2, слайд №79
Описание слайда:

Слайд 80


Проверка статистических гипотез. Версия 2, слайд №80
Описание слайда:

Слайд 81


Проверка статистических гипотез. Версия 2, слайд №81
Описание слайда:

Слайд 82





     Лекарство
    Иногда оно опаснее болезни...
Выбросы — удаляем (осторожно!)
Асимметрия — преобразуем данные (например, логарифмируем, или преобразование Бокса-Кокса)
Бимодальность — разбиваем выборку на подвыборки
Описание слайда:
Лекарство Иногда оно опаснее болезни... Выбросы — удаляем (осторожно!) Асимметрия — преобразуем данные (например, логарифмируем, или преобразование Бокса-Кокса) Бимодальность — разбиваем выборку на подвыборки

Слайд 83





Пример 1
Население городов России в 1959 году
Исходные данные
Логарифм населения
Описание слайда:
Пример 1 Население городов России в 1959 году Исходные данные Логарифм населения

Слайд 84





Пример 2
Альбукерк – продажи домов
Описание слайда:
Пример 2 Альбукерк – продажи домов

Слайд 85






Сравнение центров распределений
Описание слайда:
Сравнение центров распределений

Слайд 86





Сравнение центров распределений 
Центр распределения - то одно единственное число, которое описывало, характеризовало бы выборку. 
В качестве центра чаще всего используют среднее арифметическое, медиану или усеченное среднее.
Описание слайда:
Сравнение центров распределений Центр распределения - то одно единственное число, которое описывало, характеризовало бы выборку. В качестве центра чаще всего используют среднее арифметическое, медиану или усеченное среднее.

Слайд 87





Другие методы 
оценки центра распределения
Andrews; Bickel; Hampel; Huber; Rogers, Tukey. 
Robust estimates of location: survey and advances. 
1972  Princeton University Press
Описание слайда:
Другие методы оценки центра распределения Andrews; Bickel; Hampel; Huber; Rogers, Tukey. Robust estimates of location: survey and advances. 1972 Princeton University Press

Слайд 88





Среднее арифметическое или медиана?
Если распределение хотя бы одной из выборок существенно отличается от нормального, в качестве центра предлагается использовать медиану. 
В остальных случаях, то есть если  распределение каждой выборки можно считать нормальным или несущественно отличающимся от нормального, в качестве центра предлагается использовать среднее арифметическое.
Описание слайда:
Среднее арифметическое или медиана? Если распределение хотя бы одной из выборок существенно отличается от нормального, в качестве центра предлагается использовать медиану. В остальных случаях, то есть если распределение каждой выборки можно считать нормальным или несущественно отличающимся от нормального, в качестве центра предлагается использовать среднее арифметическое.

Слайд 89





Выбор центра распределения
Если центром распределения выбрана медиана, центры сравниваются с помощью критерия Манна – Уитни-Вилкоксона.
Если центром распределения выбрано среднее арифметическое, центры сравниваются с помощью одной из версий  критерия Стьюдента.
Описание слайда:
Выбор центра распределения Если центром распределения выбрана медиана, центры сравниваются с помощью критерия Манна – Уитни-Вилкоксона. Если центром распределения выбрано среднее арифметическое, центры сравниваются с помощью одной из версий критерия Стьюдента.

Слайд 90





Примеры
Обучение менеджеров
Магазины
Описание слайда:
Примеры Обучение менеджеров Магазины

Слайд 91





Парные и независимые выборки
В случае парных выборок имеются пары наблюдений (измерений) одного и того же объекта. 
Вариант: пары измерений делались в один и тот же момент.
Описание слайда:
Парные и независимые выборки В случае парных выборок имеются пары наблюдений (измерений) одного и того же объекта. Вариант: пары измерений делались в один и тот же момент.

Слайд 92





Независимые выборки
В случае независимых выборок каждое наблюдение соответствует отдельному объекту, т.е. измеряются разные объекты. 
Принадлежность объектов выборкам определяется по значениям дополнительной группирующей переменной.
Описание слайда:
Независимые выборки В случае независимых выборок каждое наблюдение соответствует отдельному объекту, т.е. измеряются разные объекты. Принадлежность объектов выборкам определяется по значениям дополнительной группирующей переменной.

Слайд 93





Независимые и парные выборки
Если выборки парные, используется опция paired = TRUE.
Если выборки независимые, используется опция paired = FALSE.
Описание слайда:
Независимые и парные выборки Если выборки парные, используется опция paired = TRUE. Если выборки независимые, используется опция paired = FALSE.

Слайд 94





Примеры
Время в магазинах
Альбукерк
Описание слайда:
Примеры Время в магазинах Альбукерк

Слайд 95





Сравнение медиан выборок 
Гипотеза: Медианы равны.
Альтернативная гипотеза: Медианы различаются.
Описание слайда:
Сравнение медиан выборок Гипотеза: Медианы равны. Альтернативная гипотеза: Медианы различаются.

Слайд 96





Статистика критерия Манна-Уитни U
U1 = n1*n2 + {n1 * (n1 + 1)/2} — T1
 U2 = n1*n2 + {n2 * (n2 + 1)/2} — T2
U = min(U1, U2)
Ti — сумма рангов в объединенной выборке наблюдений из выборки i
n1 и n2 — размеры выборок
Описание слайда:
Статистика критерия Манна-Уитни U U1 = n1*n2 + {n1 * (n1 + 1)/2} — T1 U2 = n1*n2 + {n2 * (n2 + 1)/2} — T2 U = min(U1, U2) Ti — сумма рангов в объединенной выборке наблюдений из выборки i n1 и n2 — размеры выборок

Слайд 97





Статистика критерия Манна-Уитни
идея метода
Обозначим одну выборку x, другую y.
 
 Для каждого наблюдения из выборки x сосчитаем число тех наблюдений в выборке y, которые меньше его. (Для нагладности, пока считаем, что совпадений нет). 
Сложим все полученные числа.
Описание слайда:
Статистика критерия Манна-Уитни идея метода Обозначим одну выборку x, другую y. Для каждого наблюдения из выборки x сосчитаем число тех наблюдений в выборке y, которые меньше его. (Для нагладности, пока считаем, что совпадений нет). Сложим все полученные числа.

Слайд 98





                  Важно!
Критерий Манна-Уитни проверяет не равенство медиан, а другое утверждение. 
Имеются две выборки наблюдений случайных величин Х и Y. 
Гипотеза: Случайные величины X и Y таковы, что P{X>Y}=1/2.
Альтернативная гипотеза: Случайные величины X и Y таковы, что P{X>Y}≠1/2.
 Для практических целей различие, тем не менее, несущественно
Описание слайда:
Важно! Критерий Манна-Уитни проверяет не равенство медиан, а другое утверждение. Имеются две выборки наблюдений случайных величин Х и Y. Гипотеза: Случайные величины X и Y таковы, что P{X>Y}=1/2. Альтернативная гипотеза: Случайные величины X и Y таковы, что P{X>Y}≠1/2. Для практических целей различие, тем не менее, несущественно

Слайд 99






Under more strict assumptions than those above, e.g., if the responses are assumed to be continuous and the alternative is restricted to a shift in location (i.e. F1(x) = F2(x + δ)), we can interpret a significant MWW test as showing a difference in medians.
Описание слайда:
Under more strict assumptions than those above, e.g., if the responses are assumed to be continuous and the alternative is restricted to a shift in location (i.e. F1(x) = F2(x + δ)), we can interpret a significant MWW test as showing a difference in medians.

Слайд 100





Критерий 
Манна-Уитни-Вилкоксона
wilcox.test(x, y, 
     alternative = "two.sided", 
     paired = FALSE, 
     exact = TRUE, 
     correct = FALSE)
Описание слайда:
Критерий Манна-Уитни-Вилкоксона wilcox.test(x, y, alternative = "two.sided", paired = FALSE, exact = TRUE, correct = FALSE)

Слайд 101





Примеры
Время в магазинах
Альбукерк
Описание слайда:
Примеры Время в магазинах Альбукерк

Слайд 102





Сравнение средних значений выборок 
Гипотеза: Математические ожидания равны.
Альтернативная гипотеза: Математические ожидания различны.
Описание слайда:
Сравнение средних значений выборок Гипотеза: Математические ожидания равны. Альтернативная гипотеза: Математические ожидания различны.

Слайд 103





T-критерий Стьюдента
t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = FALSE)
Описание слайда:
T-критерий Стьюдента t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = FALSE)

Слайд 104





Выбор статистического критерия
Если выборки парные, рекомендуется использовать парный t-критерий Стьюдента.
Если выборки независимые, рекомендуется использовать t-критерий Стьюдента для 2-х независимых выборок.
Описание слайда:
Выбор статистического критерия Если выборки парные, рекомендуется использовать парный t-критерий Стьюдента. Если выборки независимые, рекомендуется использовать t-критерий Стьюдента для 2-х независимых выборок.

Слайд 105





Надо еще сравнить дисперсии - 1
Метод 1
F-test of equality of variances
Не рекомендуется, слишком чувствителен к отклонениям от нормальности. См.
http://en.wikipedia.org/wiki/F-test_of_equality_of_variances
var.test(x, y)
Описание слайда:
Надо еще сравнить дисперсии - 1 Метод 1 F-test of equality of variances Не рекомендуется, слишком чувствителен к отклонениям от нормальности. См. http://en.wikipedia.org/wiki/F-test_of_equality_of_variances var.test(x, y)

Слайд 106





Надо еще сравнить дисперсии - 2
Метод 2
Bartlett's test
Если данные нормально распределены, лучший вариант. 
Не рекомендуется: чувствителен к отклонениям от нормальности; 
Если данные не нормальны, часто дает  "false positive" результат.
Описание слайда:
Надо еще сравнить дисперсии - 2 Метод 2 Bartlett's test Если данные нормально распределены, лучший вариант. Не рекомендуется: чувствителен к отклонениям от нормальности; Если данные не нормальны, часто дает "false positive" результат.

Слайд 107





Надо еще сравнить дисперсии - 2
Метод 2
Bartlett's test
bartlett.test(x, g, data=data.table)
bartlett.test(x~g, data=data.table)
Описание слайда:
Надо еще сравнить дисперсии - 2 Метод 2 Bartlett's test bartlett.test(x, g, data=data.table) bartlett.test(x~g, data=data.table)

Слайд 108





Надо еще сравнить дисперсии - 3
Levene's test
Критерий Ливиня/Левена 
Содержится в пакете car
Описание слайда:
Надо еще сравнить дисперсии - 3 Levene's test Критерий Ливиня/Левена Содержится в пакете car

Слайд 109





Надо еще сравнить дисперсии - 3
Levene's test
library(car)
leveneTest(x~g, data=data.table)
Описание слайда:
Надо еще сравнить дисперсии - 3 Levene's test library(car) leveneTest(x~g, data=data.table)

Слайд 110





Надо еще сравнить дисперсии - 4
Fligner-Killeen test
Робастный, рекомендуется.
Хотя есть еще Brown-Forsythe test, возможно он еще лучше...
Описание слайда:
Надо еще сравнить дисперсии - 4 Fligner-Killeen test Робастный, рекомендуется. Хотя есть еще Brown-Forsythe test, возможно он еще лучше...

Слайд 111





Надо еще сравнить дисперсии - 4
Fligner-Killeen test
fligner.test(x~g, data=data.table)
Описание слайда:
Надо еще сравнить дисперсии - 4 Fligner-Killeen test fligner.test(x~g, data=data.table)

Слайд 112





Примеры
Время в магазинах
Альбукерк
Описание слайда:
Примеры Время в магазинах Альбукерк

Слайд 113





Гипотеза независимости
Основная гипотеза:
Случайные величины X и Y независимы
Альтернативная гипотеза:
Случайные величины X и Y зависимы
Описание слайда:
Гипотеза независимости Основная гипотеза: Случайные величины X и Y независимы Альтернативная гипотеза: Случайные величины X и Y зависимы

Слайд 114





На практике:
Отвечаем на вопрос: переменная X влияет на переменную Y?
Описание слайда:
На практике: Отвечаем на вопрос: переменная X влияет на переменную Y?

Слайд 115





Комментарий
Если неизвестно, что на что влияет:
X на Y или 
Y на X
статистический критерий не поможет!
Описание слайда:
Комментарий Если неизвестно, что на что влияет: X на Y или Y на X статистический критерий не поможет!

Слайд 116






Пример Бернарда Шоу
Описание слайда:
Пример Бернарда Шоу

Слайд 117





Диаграмма рассеивания
Иногда пишут - диаграмма рассеяния
Пример – швейцарские банкноты.
Описание слайда:
Диаграмма рассеивания Иногда пишут - диаграмма рассеяния Пример – швейцарские банкноты.

Слайд 118





Зависимость -1
X – в количественной шкале
Y – в количественной шкале
Применяется коэффициент корреляции Пирсона
Или Спирмена
Иногда - Кендалла
Описание слайда:
Зависимость -1 X – в количественной шкале Y – в количественной шкале Применяется коэффициент корреляции Пирсона Или Спирмена Иногда - Кендалла

Слайд 119





Функциональная зависимость
Описание слайда:
Функциональная зависимость

Слайд 120





Статистическая зависимость 
двух переменных
Обобщение функциональной зависимости.
Одному и тому же значению x могут соответствовать разные значения y. 
Например, один и тот же товар (например, телефон) может продаваться в разных магазинах по разной цене, то есть одному и тому же товару соответствуют разные цены.
Описание слайда:
Статистическая зависимость двух переменных Обобщение функциональной зависимости. Одному и тому же значению x могут соответствовать разные значения y. Например, один и тот же товар (например, телефон) может продаваться в разных магазинах по разной цене, то есть одному и тому же товару соответствуют разные цены.

Слайд 121





статистическая зависимость
Определение статистическая зависимость – это функциональная зависимость СРЕДНЕГО значения переменной y от значения переменной x. 
 Откуда появляется среднее значение? Проводятся эксперименты (или наблюдается явление) при одном и том же значении x, при этом регистрируются разные значения y, затем эти значения усредняются. 
На практике не всегда заметно, что одному и тому же значению переменной x может соответствовать много значений y, например когда повторные наблюдения при одном значении x не делались.
Описание слайда:
статистическая зависимость Определение статистическая зависимость – это функциональная зависимость СРЕДНЕГО значения переменной y от значения переменной x. Откуда появляется среднее значение? Проводятся эксперименты (или наблюдается явление) при одном и том же значении x, при этом регистрируются разные значения y, затем эти значения усредняются. На практике не всегда заметно, что одному и тому же значению переменной x может соответствовать много значений y, например когда повторные наблюдения при одном значении x не делались.

Слайд 122





среднее значение переменной y равно натуральному логарифму значения  x.
Описание слайда:
среднее значение переменной y равно натуральному логарифму значения x.

Слайд 123





среднее значение переменной y равно натуральному логарифму значения  x.
Описание слайда:
среднее значение переменной y равно натуральному логарифму значения x.

Слайд 124






Коэффициент корреляции как «градусник», измеряющий степень зависимости
Формула для коэффициента корреляции
Описание слайда:
Коэффициент корреляции как «градусник», измеряющий степень зависимости Формула для коэффициента корреляции

Слайд 125





Выбор коэффициента
Если распределение каждой переменной несущественно отличается от нормального, применяется коэффициент корреляции Пирсона
В остальных случаях - коэффициент корреляции Спирмена
Вместо коэффициента корреляции Спирмена используют коэффициент корреляции Кендалла
Описание слайда:
Выбор коэффициента Если распределение каждой переменной несущественно отличается от нормального, применяется коэффициент корреляции Пирсона В остальных случаях - коэффициент корреляции Спирмена Вместо коэффициента корреляции Спирмена используют коэффициент корреляции Кендалла

Слайд 126


Проверка статистических гипотез. Версия 2, слайд №126
Описание слайда:

Слайд 127






Как проявляется зависимость на диаграмме рассеивания
Описание слайда:
Как проявляется зависимость на диаграмме рассеивания

Слайд 128





Коэффициент корреляции равен 1
Описание слайда:
Коэффициент корреляции равен 1

Слайд 129





Коэффициент корреляции равен 0.9
Описание слайда:
Коэффициент корреляции равен 0.9

Слайд 130





Коэффициент корреляции равен 0.8
Описание слайда:
Коэффициент корреляции равен 0.8

Слайд 131





Коэффициент корреляции равен 0.6
Описание слайда:
Коэффициент корреляции равен 0.6

Слайд 132





Коэффициент корреляции равен 0.4
Описание слайда:
Коэффициент корреляции равен 0.4

Слайд 133





Коэффициент корреляции равен 0.2
Описание слайда:
Коэффициент корреляции равен 0.2

Слайд 134





Коэффициент корреляции равен 0.
Описание слайда:
Коэффициент корреляции равен 0.

Слайд 135






Проблемы и ошибки при использовании коэффициента корреляции
Описание слайда:
Проблемы и ошибки при использовании коэффициента корреляции

Слайд 136


Проверка статистических гипотез. Версия 2, слайд №136
Описание слайда:

Слайд 137


Проверка статистических гипотез. Версия 2, слайд №137
Описание слайда:

Слайд 138





Данные без выброса 
коэффициент корреляции равен -0.81
Описание слайда:
Данные без выброса коэффициент корреляции равен -0.81

Слайд 139





Добавлен выброс в точке (10,10). Коэффициент корреляции упал до -0,55.
Описание слайда:
Добавлен выброс в точке (10,10). Коэффициент корреляции упал до -0,55.

Слайд 140





Выброс сдвинут в точку (18,5, 18,5) Коэффициент равен 0
Описание слайда:
Выброс сдвинут в точку (18,5, 18,5) Коэффициент равен 0

Слайд 141





Выброс сдвинут в точку (53, 53). Корреляция равна +0,81
Описание слайда:
Выброс сдвинут в точку (53, 53). Корреляция равна +0,81

Слайд 142






Ложная корреляция
Описание слайда:
Ложная корреляция

Слайд 143





Зависимость -2
X – в количественной шкале
Y – в номинальной шкале
Сравниваем средние или медианы в группах
Или перекодируем количественную переменную, переводим ее в номинальную шкалу
Описание слайда:
Зависимость -2 X – в количественной шкале Y – в номинальной шкале Сравниваем средние или медианы в группах Или перекодируем количественную переменную, переводим ее в номинальную шкалу

Слайд 144





Зависимость -3
X – в порядковой шкале
Y – в порядковой шкале
Используем коэффициент корреляции Спирмена
Или Кендалла
Описание слайда:
Зависимость -3 X – в порядковой шкале Y – в порядковой шкале Используем коэффициент корреляции Спирмена Или Кендалла

Слайд 145





Зависимость -4
X – в номинальной шкале
Y – в номинальной шкале
Таблица сопряженности и критерий χ²
Описание слайда:
Зависимость -4 X – в номинальной шкале Y – в номинальной шкале Таблица сопряженности и критерий χ²

Слайд 146






Критерий хи-квадрат
Формула для статистики
Описание слайда:
Критерий хи-квадрат Формула для статистики

Слайд 147





Статистика хи-квадрат как коэффициент корреляции
Коэффициент Пирсона
Коэффициент Чупрова
Описание слайда:
Статистика хи-квадрат как коэффициент корреляции Коэффициент Пирсона Коэффициент Чупрова

Слайд 148






Примеры типичных ошибок при использовании критерия хи-квадрат
Описание слайда:
Примеры типичных ошибок при использовании критерия хи-квадрат

Слайд 149





Пример 1
Действительно ли использование Internet связано с полом?
Все опрошенные пользуются Интернетом. Тех из них, кто использует Интернет пять часов в месяц или меньше,  отнесли к мало пользующимся, остальных – к активным пользователям.
Описание слайда:
Пример 1 Действительно ли использование Internet связано с полом? Все опрошенные пользуются Интернетом. Тех из них, кто использует Интернет пять часов в месяц или меньше, отнесли к мало пользующимся, остальных – к активным пользователям.

Слайд 150





Пример 1
sex = пол.
	Кодировка: "1" – мужчина, "0" – женщина.
internet = использование Internet.
	Кодировка: "0" – использует мало, "1" – использует активно.
	
	Имеется 30 наблюдений (опрошенных).
Описание слайда:
Пример 1 sex = пол. Кодировка: "1" – мужчина, "0" – женщина. internet = использование Internet. Кодировка: "0" – использует мало, "1" – использует активно. Имеется 30 наблюдений (опрошенных).

Слайд 151





Пример 1
Описание слайда:
Пример 1

Слайд 152





Пример 2
В результате изучения связи между покупкой модной одежды и семейным положением получены, среди прочих, следующие данные. 
	
	Имеется 1000 наблюдений (опрошенных).
Описание слайда:
Пример 2 В результате изучения связи между покупкой модной одежды и семейным положением получены, среди прочих, следующие данные. Имеется 1000 наблюдений (опрошенных).

Слайд 153





Пример 2
Переменные.
sex = пол.
	Кодировка: "1" – мужчина, "0" – женщина.
marriage  =  семейное положение.
	Кодировка: "1" – женат/замужем, "0" – не женат/не замужем.
fashion = покупка модной одежды.
	Кодировка: "0" – покупает мало, "1" – покупает много.
Описание слайда:
Пример 2 Переменные. sex = пол. Кодировка: "1" – мужчина, "0" – женщина. marriage = семейное положение. Кодировка: "1" – женат/замужем, "0" – не женат/не замужем. fashion = покупка модной одежды. Кодировка: "0" – покупает мало, "1" – покупает много.

Слайд 154





Пример 2
Описание слайда:
Пример 2

Слайд 155





Пример 2
Описание слайда:
Пример 2

Слайд 156





Пример 2
Описание слайда:
Пример 2

Слайд 157





Пример 3
Маркетолог проводит исследование для рекламного агентства, разрабатывающего рекламу для автомобилей стоимостью свыше 30 тысяч долларов. 
Он пытается проанализировать факторы, влияющие на владение дорогими автомобилями.
Описание слайда:
Пример 3 Маркетолог проводит исследование для рекламного агентства, разрабатывающего рекламу для автомобилей стоимостью свыше 30 тысяч долларов. Он пытается проанализировать факторы, влияющие на владение дорогими автомобилями.

Слайд 158





Пример 3
Переменные.
high_edu = образование.
	Кодировка: "1" – высшее образование, "0" – нет высшего образования.
expe_car  =  наличие дорогого автомобиля.
	Кодировка: "0" – дорогого автомобиля нет, "1" – дорогой автомобиль есть.
income = доход.
	Кодировка: "0" – низкий доход, "1" – высокий доход.
	
	Имеется 1000 наблюдений (опрошенных).
Описание слайда:
Пример 3 Переменные. high_edu = образование. Кодировка: "1" – высшее образование, "0" – нет высшего образования. expe_car = наличие дорогого автомобиля. Кодировка: "0" – дорогого автомобиля нет, "1" – дорогой автомобиль есть. income = доход. Кодировка: "0" – низкий доход, "1" – высокий доход. Имеется 1000 наблюдений (опрошенных).

Слайд 159





Пример 3
Описание слайда:
Пример 3

Слайд 160





Пример 3
Описание слайда:
Пример 3

Слайд 161





Пример 3
Описание слайда:
Пример 3

Слайд 162





Пример 4
Маркетолог, исследующий сферу туристических поездок за границу, предположил, что на желание путешествовать влияет возраст. 
Имеющиеся в его распоряжении данные содержат, среди прочего, следующую информацию.
Описание слайда:
Пример 4 Маркетолог, исследующий сферу туристических поездок за границу, предположил, что на желание путешествовать влияет возраст. Имеющиеся в его распоряжении данные содержат, среди прочего, следующую информацию.

Слайд 163





Пример 4
Переменные.
desire = желание совершить путешествие за границу.
	Кодировка: "1" – желание есть, "0" – желания нет.
sex  =  пол.
	Кодировка: "0" – женщина, "1" – мужчина.
age = возраст.
	Кодировка: "0" –до 45 лет, "1" – 45 лет или старше.
	
	Имеется 1000 наблюдений (опрошенных).
Описание слайда:
Пример 4 Переменные. desire = желание совершить путешествие за границу. Кодировка: "1" – желание есть, "0" – желания нет. sex = пол. Кодировка: "0" – женщина, "1" – мужчина. age = возраст. Кодировка: "0" –до 45 лет, "1" – 45 лет или старше. Имеется 1000 наблюдений (опрошенных).

Слайд 164





Пример 4
Описание слайда:
Пример 4

Слайд 165





Пример 4
Описание слайда:
Пример 4

Слайд 166





Пример 4
Описание слайда:
Пример 4

Слайд 167





Пример 4
Описание слайда:
Пример 4

Слайд 168





Пример 5
Результаты анкетирования о проведении семейного досуга содержат, среди прочего, следующую информацию.
Переменные.
fastfood = частота посещения ресторанов быстрого питания.
	Кодировка: "1" – часто, "0" – редко.
income  =  доход семьи.
	Кодировка: "1" – высокий, "0" – низкий.
family = размер семьи.
	Кодировка: "1" – большая семья, "0" – малая семья.
Описание слайда:
Пример 5 Результаты анкетирования о проведении семейного досуга содержат, среди прочего, следующую информацию. Переменные. fastfood = частота посещения ресторанов быстрого питания. Кодировка: "1" – часто, "0" – редко. income = доход семьи. Кодировка: "1" – высокий, "0" – низкий. family = размер семьи. Кодировка: "1" – большая семья, "0" – малая семья.

Слайд 169





Пример 5
Описание слайда:
Пример 5

Слайд 170





Пример 5
Описание слайда:
Пример 5

Слайд 171





Пример 5
Описание слайда:
Пример 5



Похожие презентации
Mypresentation.ru
Загрузить презентацию