🗊Презентация Проверка статистических гипотез (лекция 8)

Категория: Математика
Нажмите для полного просмотра!
Проверка статистических гипотез (лекция 8), слайд №1Проверка статистических гипотез (лекция 8), слайд №2Проверка статистических гипотез (лекция 8), слайд №3Проверка статистических гипотез (лекция 8), слайд №4Проверка статистических гипотез (лекция 8), слайд №5Проверка статистических гипотез (лекция 8), слайд №6Проверка статистических гипотез (лекция 8), слайд №7Проверка статистических гипотез (лекция 8), слайд №8Проверка статистических гипотез (лекция 8), слайд №9Проверка статистических гипотез (лекция 8), слайд №10Проверка статистических гипотез (лекция 8), слайд №11Проверка статистических гипотез (лекция 8), слайд №12Проверка статистических гипотез (лекция 8), слайд №13Проверка статистических гипотез (лекция 8), слайд №14Проверка статистических гипотез (лекция 8), слайд №15Проверка статистических гипотез (лекция 8), слайд №16Проверка статистических гипотез (лекция 8), слайд №17

Вы можете ознакомиться и скачать презентацию на тему Проверка статистических гипотез (лекция 8). Доклад-сообщение содержит 17 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1



















Лекция 8




Проверка статистических гипотез
 
 
Статистическая гипотеза. Критерии, используемые для проверки однородности гидрологических рядов. Критерий Стьюдента. Критерий равенства двух дисперсий. Рангово – суммарный критерий. 


 (Ахметов С.К.)
Описание слайда:
Лекция 8 Проверка статистических гипотез Статистическая гипотеза. Критерии, используемые для проверки однородности гидрологических рядов. Критерий Стьюдента. Критерий равенства двух дисперсий. Рангово – суммарный критерий. (Ахметов С.К.)

Слайд 2





Определения 
Статистическая гипотеза – это предположение о каком-то свойстве генеральной совокупности
Например, что mx генеральной  совокупности равно какому–то числу 
Нулевая гипотеза – это когда предполагается, что среднее значение выборки x1, x2, x3….xn (если n большое) мало отличаться от mx генеральной совокупности
Альтернативная гипотеза Н1 – это когда предполагается, что mx ≠ хср, mx > хср,  mx < хср

Критерий (тест) статистической гипотезы  - это правило, позволяющее принять или отвергнуть гипотезу

Статистики – это определенные функции g (x1, x2, x3….xn), используемые  для выполнения теста
Описание слайда:
Определения Статистическая гипотеза – это предположение о каком-то свойстве генеральной совокупности Например, что mx генеральной совокупности равно какому–то числу Нулевая гипотеза – это когда предполагается, что среднее значение выборки x1, x2, x3….xn (если n большое) мало отличаться от mx генеральной совокупности Альтернативная гипотеза Н1 – это когда предполагается, что mx ≠ хср, mx > хср, mx < хср Критерий (тест) статистической гипотезы - это правило, позволяющее принять или отвергнуть гипотезу Статистики – это определенные функции g (x1, x2, x3….xn), используемые для выполнения теста

Слайд 3





Пример статистики
 Рассмотрим выборку с параметрами xср, Sx (СКО)
 Допустим, что mx = 12. 
 Нулевая гипотеза (Н0). Разница (xср - mx) достаточно мала
 Эту разницу можно рассматривать в качестве анализируемой статистики
 Но на практике используют другую статистику t = (xср - mx)/(Sx/√n), так как соответствие с теоремой 2 прошлой лекции заранее известно, что это выражение подчиняется распределению Стьюдента
 На использовании этой статистики базируется критерий Стьюдента, который можно использовать для проверки нулевой гипотезы
 С этой целью для конкретной реализации рассчитывают эмпирическое значение статистики Стьюдента t*. Например, n=36, xср =11, Sx = 5, t* = 1.2.
 Величина t* является СВ и для выборок различной длины значение t* будет различным
 Область возможных  значений (ОВЗ) этой статистики  - вся числовая ось
 ОВЗ делиться на две области: 
- область принятия гипотезы 
 критическая  область
 Если t* попадает в область принятия гипотезы, то Н0 не опровергается, если в критическую область, то Н0 опровергается.
Описание слайда:
Пример статистики Рассмотрим выборку с параметрами xср, Sx (СКО) Допустим, что mx = 12. Нулевая гипотеза (Н0). Разница (xср - mx) достаточно мала Эту разницу можно рассматривать в качестве анализируемой статистики Но на практике используют другую статистику t = (xср - mx)/(Sx/√n), так как соответствие с теоремой 2 прошлой лекции заранее известно, что это выражение подчиняется распределению Стьюдента На использовании этой статистики базируется критерий Стьюдента, который можно использовать для проверки нулевой гипотезы С этой целью для конкретной реализации рассчитывают эмпирическое значение статистики Стьюдента t*. Например, n=36, xср =11, Sx = 5, t* = 1.2. Величина t* является СВ и для выборок различной длины значение t* будет различным Область возможных значений (ОВЗ) этой статистики - вся числовая ось ОВЗ делиться на две области: - область принятия гипотезы критическая область Если t* попадает в область принятия гипотезы, то Н0 не опровергается, если в критическую область, то Н0 опровергается.

Слайд 4





Доверительная область 
 Доверительная область (доверительный интервал) - область принятия гипотезы
 Доверительная вероятность (рд) –  вероятность получения значения t* по произвольной выборке. 
 Геометрически эта вероятность показана (заштрихована) на рисунке
Описание слайда:
Доверительная область Доверительная область (доверительный интервал) - область принятия гипотезы Доверительная вероятность (рд) – вероятность получения значения t* по произвольной выборке. Геометрически эта вероятность показана (заштрихована) на рисунке

Слайд 5





Уровень значимости
 Вероятность попадания t* в критическую область равна α = 1 - рд. Здесь α – уровень значимости
Если критическая область состоит из двух частей, то вместо α  пишут 2α = 1 - рд , где 2α  указывает на то, что уровень значимости двухсторонний
В гидрологической практике наиболее часто используют уровни значимости 5 и 10%
К примеру, если принять уровень значимости 2α = 10% то, используя таблицу распределения Стьюдента при ν = n – 1 = 35, получим теоретическое значение t – статистики равное 1,69. Это означает, что доверительная область представлена отрезком    [-1,69, + 1,69]   
Если t* = - 1,20 (по фактическим данным), значить t* попадает в доверительную область, первоначальная нулевая  гипотеза не опровергается, то есть можно считать, что разница между mx и xср  является статистически не значимой 
Хотя в данном случае речь идет о конкретном критерии (Стьюдента), основные принципы проверки нулевой гипотезы сохраняются и при использовании других критериев.
Описание слайда:
Уровень значимости Вероятность попадания t* в критическую область равна α = 1 - рд. Здесь α – уровень значимости Если критическая область состоит из двух частей, то вместо α пишут 2α = 1 - рд , где 2α указывает на то, что уровень значимости двухсторонний В гидрологической практике наиболее часто используют уровни значимости 5 и 10% К примеру, если принять уровень значимости 2α = 10% то, используя таблицу распределения Стьюдента при ν = n – 1 = 35, получим теоретическое значение t – статистики равное 1,69. Это означает, что доверительная область представлена отрезком [-1,69, + 1,69] Если t* = - 1,20 (по фактическим данным), значить t* попадает в доверительную область, первоначальная нулевая гипотеза не опровергается, то есть можно считать, что разница между mx и xср является статистически не значимой Хотя в данном случае речь идет о конкретном критерии (Стьюдента), основные принципы проверки нулевой гипотезы сохраняются и при использовании других критериев.

Слайд 6





Уровень значимости (α) и доверительная 
вероятность для различных альтернативных гипотез
Описание слайда:
Уровень значимости (α) и доверительная вероятность для различных альтернативных гипотез

Слайд 7





Критерии, используемые 
для проверки  однородности гидрологических рядов 
  Используются критерии двух типов: параметрические и непараметрические

 В параметрических критериях используются выборочные оценки параметров распределения (критерии Стьюдента и Фишера). При этом считается, что выборка относится к генеральной совокупности с известным законом распределения (обычно с нормальным законом)
 Непараметрические критерии основываются на использовании непараметрических статистик. Статистика  g (x1, x2, x3….xn),  является непараметрической, если ее распределение не зависит от распределения Х
Описание слайда:
Критерии, используемые для проверки однородности гидрологических рядов Используются критерии двух типов: параметрические и непараметрические В параметрических критериях используются выборочные оценки параметров распределения (критерии Стьюдента и Фишера). При этом считается, что выборка относится к генеральной совокупности с известным законом распределения (обычно с нормальным законом) Непараметрические критерии основываются на использовании непараметрических статистик. Статистика g (x1, x2, x3….xn), является непараметрической, если ее распределение не зависит от распределения Х

Слайд 8





Критерии Стьюдента для проверки
значимости различных средних значений двух выборок
 Допустим, что (х1, х2, х2 ….хn) и (у1, у2, у ….уn) – выборки длиной m и n с неизвестными параметрами mx, σx и mу, σу, но при этом известно, что σx = σу,, хотя СКО значение неизвестно. Поэтому можно записать, что σ = σx = σу
 Если выборки относятся к одной генеральной совокупности, то разность должна быть близка к нулю. На основе этой разности строиться статистика
t = (xср  - уср)/(σxср  - уср)
где σxср  - уср – СКО разности (xср  - уср). Как следует из теоремы 2, из предыдущей лекции эта статистика подчиняется распределению Стьюдента при ν = (m + n – 2). 
В математической статистике доказано, что
Описание слайда:
Критерии Стьюдента для проверки значимости различных средних значений двух выборок Допустим, что (х1, х2, х2 ….хn) и (у1, у2, у ….уn) – выборки длиной m и n с неизвестными параметрами mx, σx и mу, σу, но при этом известно, что σx = σу,, хотя СКО значение неизвестно. Поэтому можно записать, что σ = σx = σу Если выборки относятся к одной генеральной совокупности, то разность должна быть близка к нулю. На основе этой разности строиться статистика t = (xср - уср)/(σxср - уср) где σxср - уср – СКО разности (xср - уср). Как следует из теоремы 2, из предыдущей лекции эта статистика подчиняется распределению Стьюдента при ν = (m + n – 2). В математической статистике доказано, что

Слайд 9





Критерии Стьюдента для проверки
значимости различных средних значений двух выборок (2)
В окончательном виде выражение для статистики  t имеет вид
Описание слайда:
Критерии Стьюдента для проверки значимости различных средних значений двух выборок (2) В окончательном виде выражение для статистики t имеет вид

Слайд 10





Критерий равенства двух дисперсий
 Если (х1, х2, х2 ….хn) и (у1, у2, у ….уn) – выборки из нормальной совокупности с параметрами mx, σx, и mу, σу и если σx = σу = σ, то в соответствие с теоремами 1 и 3 из предыдущей лекции, отношение их выборочных дисперсий Sx2/Sy2 подчиняется распределению Фишера с числом степеней свободы ν1 = m-1 и ν2 = n-1
 Следовательно, при нулевой гипотезе H0  (т.е. при предположении о том, что Sx2 = Sy2) и при уровне значимости 2α доверительная значимость для отношения Sx2/Sy2 определяется выражением
Fα (ν1, ν2,) ≤ (Sx2/Sy2) < F1- α (ν1, ν2)  или   1/F1- α ≤ (Sx2/Sy2) < F1- α
 Распределение Фишера является несимметричным и для того, чтобы сократить объем таблиц, их составляют только для F > 1, а при сравнении Sx2 и Sy2 в числитель всегда подставляют большую дисперсию. В этом случае доверительная область при уровне значимости 2α определяется выражением 
1 ≤ (Sx2/Sy2) < F1- α

 Этот критерий используется для проверки однородности гидрологических рядов по дисперсии.
Описание слайда:
Критерий равенства двух дисперсий Если (х1, х2, х2 ….хn) и (у1, у2, у ….уn) – выборки из нормальной совокупности с параметрами mx, σx, и mу, σу и если σx = σу = σ, то в соответствие с теоремами 1 и 3 из предыдущей лекции, отношение их выборочных дисперсий Sx2/Sy2 подчиняется распределению Фишера с числом степеней свободы ν1 = m-1 и ν2 = n-1 Следовательно, при нулевой гипотезе H0 (т.е. при предположении о том, что Sx2 = Sy2) и при уровне значимости 2α доверительная значимость для отношения Sx2/Sy2 определяется выражением Fα (ν1, ν2,) ≤ (Sx2/Sy2) < F1- α (ν1, ν2) или 1/F1- α ≤ (Sx2/Sy2) < F1- α Распределение Фишера является несимметричным и для того, чтобы сократить объем таблиц, их составляют только для F > 1, а при сравнении Sx2 и Sy2 в числитель всегда подставляют большую дисперсию. В этом случае доверительная область при уровне значимости 2α определяется выражением 1 ≤ (Sx2/Sy2) < F1- α Этот критерий используется для проверки однородности гидрологических рядов по дисперсии.

Слайд 11





Расчет по критерию Фишера
 Исходный ряд делится на две части
 Оцениваются дисперсии для каждой из частей ряда и вычисляются эмпирическое значение статистики Фишера F* ≤ Sx2/Sy2, где Sx2 > Sy2.
 Полученное значение F* сравниваются с табличным значением F1- α. 
 Если при принятом уровне значимости оказывается, что F*< F1- α, то расхождение дисперсий считается незначимым и гипотеза об однородности ряда по дисперсии не опровергается
 Критерий Фишера (также как и критерий Стьюдента) относится к категории стандартных критериев и рекомендуется в большинстве нормативных документов в качестве официального теста на однородность.
Описание слайда:
Расчет по критерию Фишера Исходный ряд делится на две части Оцениваются дисперсии для каждой из частей ряда и вычисляются эмпирическое значение статистики Фишера F* ≤ Sx2/Sy2, где Sx2 > Sy2. Полученное значение F* сравниваются с табличным значением F1- α. Если при принятом уровне значимости оказывается, что F*< F1- α, то расхождение дисперсий считается незначимым и гипотеза об однородности ряда по дисперсии не опровергается Критерий Фишера (также как и критерий Стьюдента) относится к категории стандартных критериев и рекомендуется в большинстве нормативных документов в качестве официального теста на однородность.

Слайд 12





Рангово – суммарные 
критерии Вилкоксона, Вилкоксона - Манна - Уитни
 Критерии используются для проверки нулевой гипотезы о том, что две независимые выборки принадлежат к совокупностям, которые имеют идентичные функции распределения
 Критерии Вилкоксона и Манна – Уитни относятся к категории непараметрических критериев и не подразумевают непосредственного расчета выборочных параметров функции распределения
 Достоинством критериев является то, что они не требуют обязательной принадлежности выборок к нормальной совокупности
Описание слайда:
Рангово – суммарные критерии Вилкоксона, Вилкоксона - Манна - Уитни Критерии используются для проверки нулевой гипотезы о том, что две независимые выборки принадлежат к совокупностям, которые имеют идентичные функции распределения Критерии Вилкоксона и Манна – Уитни относятся к категории непараметрических критериев и не подразумевают непосредственного расчета выборочных параметров функции распределения Достоинством критериев является то, что они не требуют обязательной принадлежности выборок к нормальной совокупности

Слайд 13





Критерий Вилкоксона
  Статистика Вилкоксона. Пусть даны две выборки из совокупностей X и Y длиной m  и n (m и n). Объединим эти выборки в один ряд и расположим все значения в возрастающем порядке так, что у1<у2, у2 <х1, х1<х2 и т.д.
Описание слайда:
Критерий Вилкоксона Статистика Вилкоксона. Пусть даны две выборки из совокупностей X и Y длиной m и n (m и n). Объединим эти выборки в один ряд и расположим все значения в возрастающем порядке так, что у1<у2, у2 <х1, х1<х2 и т.д.

Слайд 14





Критерий Вилкоксона
Если расчет выполнен правильно, то должно выполняться равенство
ω1 + ω2.=  N(N+1)/2
где N = m + n
В качестве анализируемой статистики ω*  рассматривается выборка

ω* = r1 + r2 + r3 +    + rm
где  ri - ранг хi
 
Для статистики Вилкоксона разработаны таблицы, позволяющие определить доверительный интервал для ω  (в зависимости от m, n и уровня значимости 2α).  Найденное значение ω  сравнивается с математическим ожиданием статистики  M(W), которое вычисляется по формуле M(W) = (m+n+1)/2
 wB(α, n1,n2) > w    и   wН(α, n1,n2) < w
Верхнее критическое значение связано с нижним соотношением 

wB(α, n1,n2) = 2 M(W) - wН(α, n1,n2)
Однако в настоящее время более широкое распространение получила статистика, предложенная Манном и Уитни, так называемая U – статистика.
Описание слайда:
Критерий Вилкоксона Если расчет выполнен правильно, то должно выполняться равенство ω1 + ω2.= N(N+1)/2 где N = m + n В качестве анализируемой статистики ω* рассматривается выборка ω* = r1 + r2 + r3 + + rm где ri - ранг хi   Для статистики Вилкоксона разработаны таблицы, позволяющие определить доверительный интервал для ω (в зависимости от m, n и уровня значимости 2α). Найденное значение ω сравнивается с математическим ожиданием статистики M(W), которое вычисляется по формуле M(W) = (m+n+1)/2 wB(α, n1,n2) > w и wН(α, n1,n2) < w Верхнее критическое значение связано с нижним соотношением wB(α, n1,n2) = 2 M(W) - wН(α, n1,n2) Однако в настоящее время более широкое распространение получила статистика, предложенная Манном и Уитни, так называемая U – статистика.

Слайд 15





Статистика Вилкоксона - Манна - Уитни  (U – статистика)
Для определения U вычислим: 
 
U1 = m•n + m(m + 1)/2  -  ω1
 
U2 = m•n + m(m + 1)/2  -  ω2
В качестве анализируемой статистики U* можно использовать любое из полученных значений (U1 и U2). Обычно в качестве U* принимается меньшее значение. При правильном расчете должно выполняться равенство
 
U1 + U2 = m•n

Распределение U – статистики Манна – Уитни является симметричным с МО и дисперсией 
mU = (m•n)/2
 DU = σ2U = m•n(m+n+1)/12
Описание слайда:
Статистика Вилкоксона - Манна - Уитни (U – статистика) Для определения U вычислим:   U1 = m•n + m(m + 1)/2 - ω1   U2 = m•n + m(m + 1)/2 - ω2 В качестве анализируемой статистики U* можно использовать любое из полученных значений (U1 и U2). Обычно в качестве U* принимается меньшее значение. При правильном расчете должно выполняться равенство   U1 + U2 = m•n Распределение U – статистики Манна – Уитни является симметричным с МО и дисперсией mU = (m•n)/2  DU = σ2U = m•n(m+n+1)/12

Слайд 16





Статистика Вилкоксона - Манна  - Уитни  (U – статистика) 
При m ≥ 8 и n ≥ 8 функция распределения нормированной величины статистики U может быть аппроксимирована стандартным нормальным распределением. При этом доверительный интервал для статистики U при уровне значимости 2α  имеет вид:
 
mU – t1- α σU  ≤ U < mU + t1- α σU
 
где t1- α  - квантиль стандартного нормального распределения; 

mU и σU – параметры, определяемые по формулам 
 
mU = (m•n)/2
 
DU = σ2U = m•n(m+n+1)/12
 
Критерий Уилкоксона – Манна – Уитни можно использовать для проверки однородности гидрологических рядов. В этом случае исходный ряд разбивается на две выборки, длиной m и n.
 
Описание слайда:
Статистика Вилкоксона - Манна - Уитни (U – статистика) При m ≥ 8 и n ≥ 8 функция распределения нормированной величины статистики U может быть аппроксимирована стандартным нормальным распределением. При этом доверительный интервал для статистики U при уровне значимости 2α имеет вид:   mU – t1- α σU ≤ U < mU + t1- α σU   где t1- α - квантиль стандартного нормального распределения; mU и σU – параметры, определяемые по формулам   mU = (m•n)/2   DU = σ2U = m•n(m+n+1)/12   Критерий Уилкоксона – Манна – Уитни можно использовать для проверки однородности гидрологических рядов. В этом случае исходный ряд разбивается на две выборки, длиной m и n.  

Слайд 17





СПАСИБО  ЗА  ВНИМАНИЕ!
Описание слайда:
СПАСИБО ЗА ВНИМАНИЕ!



Похожие презентации
Mypresentation.ru
Загрузить презентацию