🗊Презентация Вариационный ряд, таблицы сопряженности признаков и проверка гипотез

Категория: Математика
Нажмите для полного просмотра!
Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №1Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №2Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №3Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №4Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №5Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №6Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №7Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №8Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №9Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №10Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №11Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №12Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №13Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №14Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №15Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №16Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №17Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №18Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №19Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №20Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №21Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №22Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №23Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №24Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №25Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №26Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №27Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №28Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №29Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №30Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №31Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №32Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №33Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №34Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №35Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №36Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №37Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №38Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №39Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №40Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №41Вариационный ряд, таблицы сопряженности признаков и проверка гипотез, слайд №42

Содержание

Вы можете ознакомиться и скачать презентацию на тему Вариационный ряд, таблицы сопряженности признаков и проверка гипотез. Доклад-сообщение содержит 42 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Вариационный ряд, таблицы сопряженности признаков и проверка гипотез
Подготовлено А.В. Омельяненко
Описание слайда:
Вариационный ряд, таблицы сопряженности признаков и проверка гипотез Подготовлено А.В. Омельяненко

Слайд 2





Вопросы к экзамену:
Вариационный ряд. Статистики, связанные с распределением частот. Общая схема проверки гипотезы 
Построение таблиц сопряженности признаков. Статистики сопряженности признаков. Практика построения таблиц сопряженности признаков.
Проверка гипотез: различия между значениями переменных. Параметрические критерии. Непараметрические методы проверки гипотез.
Описание слайда:
Вопросы к экзамену: Вариационный ряд. Статистики, связанные с распределением частот. Общая схема проверки гипотезы Построение таблиц сопряженности признаков. Статистики сопряженности признаков. Практика построения таблиц сопряженности признаков. Проверка гипотез: различия между значениями переменных. Параметрические критерии. Непараметрические методы проверки гипотез.

Слайд 3





ВАРИАЦИОННЫЙ РЯД
Вариационный ряд, распределение частот значений переменной (frequency distribution)		
Математическое распределение, цель которого — подсчет ответов, связанных с различными значениями одной переменной (частот), и дальнейшее выражение их в процентном виде (частости).
Описание слайда:
ВАРИАЦИОННЫЙ РЯД Вариационный ряд, распределение частот значений переменной (frequency distribution) Математическое распределение, цель которого — подсчет ответов, связанных с различными значениями одной переменной (частот), и дальнейшее выражение их в процентном виде (частости).

Слайд 4





ВАРИАЦИОННЫЙ РЯД
Цель построения вариационного ряда — подсчет ответов респондентов, в кото­рых приводятся различные значения переменной. 
Относительную частоту различ­ных значений переменной выражают в процентах и называют частостями. 
Подсчет распределения частот значений переменной дает возможность построить таблицу, с указанием частоты, частости и накопленных частостей для всех значений этой пе­ременной.
Описание слайда:
ВАРИАЦИОННЫЙ РЯД Цель построения вариационного ряда — подсчет ответов респондентов, в кото­рых приводятся различные значения переменной. Относительную частоту различ­ных значений переменной выражают в процентах и называют частостями. Подсчет распределения частот значений переменной дает возможность построить таблицу, с указанием частоты, частости и накопленных частостей для всех значений этой пе­ременной.

Слайд 5





ВАРИАЦИОННЫЙ РЯД
Позволяет получить ответы на вопросы:
Какое количество потребителей товара определенной марки можно считать ло­яльными по отношению к ней?
 Каково соотношение между разными группами потребителей того или иного товара или услуги (например, авиаперелетов): много летающие, средне, мало и совсем не летающие?
 Какое количество потребителей хорошо осведомлены о предлагаемом новом то­варе? Сколько потребителей поверхностно знакомы, сколько — что-то слыша­ли, а сколько вообще ничего не знают о данной торговой марке? Какова средняя степень осведомленности о товаре? Сильно ли различается степень осведомлен­ности потребителей о новом товаре?
 Что представляет собой кривая распределения дохода для приверженцев дан­ной марки товара? Смещено ли распределение доходов в сторону группы пот­ребителей с низкими доходами?
Описание слайда:
ВАРИАЦИОННЫЙ РЯД Позволяет получить ответы на вопросы: Какое количество потребителей товара определенной марки можно считать ло­яльными по отношению к ней? Каково соотношение между разными группами потребителей того или иного товара или услуги (например, авиаперелетов): много летающие, средне, мало и совсем не летающие? Какое количество потребителей хорошо осведомлены о предлагаемом новом то­варе? Сколько потребителей поверхностно знакомы, сколько — что-то слыша­ли, а сколько вообще ничего не знают о данной торговой марке? Какова средняя степень осведомленности о товаре? Сильно ли различается степень осведомлен­ности потребителей о новом товаре? Что представляет собой кривая распределения дохода для приверженцев дан­ной марки товара? Смещено ли распределение доходов в сторону группы пот­ребителей с низкими доходами?

Слайд 6





ВАРИАЦИОННЫЙ РЯД
помогает определить долю неответивших респондентов, а также указывает долю ошибочных ответов;
 можно установить наличие выбросов, т.е. случаев с экстремальными значениями;
Распределение частот также определя­ет форму эмпирического распределения значений переменной. 
Частотные данные можно использовать для построения гистограмм или вертикальных столбчатых диа­грамм, на которых по оси X откладывают значения переменной, а по оси Y— абсо­лютные (частоты) или относительные (частости) значения. 
По гистограмме можно проверить, соответствует ли наблюдаемое распределение предполагаемому маркетологом распределению зна­чений переменной.
Описание слайда:
ВАРИАЦИОННЫЙ РЯД помогает определить долю неответивших респондентов, а также указывает долю ошибочных ответов; можно установить наличие выбросов, т.е. случаев с экстремальными значениями; Распределение частот также определя­ет форму эмпирического распределения значений переменной. Частотные данные можно использовать для построения гистограмм или вертикальных столбчатых диа­грамм, на которых по оси X откладывают значения переменной, а по оси Y— абсо­лютные (частоты) или относительные (частости) значения. По гистограмме можно проверить, соответствует ли наблюдаемое распределение предполагаемому маркетологом распределению зна­чений переменной.

Слайд 7





СТАТИСТИКИ, СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ ЧАСТОТ
Показатели центра распределения (measures of location)
Статистики, которые характеризуют значение признака, вокруг которого концентрируются наблюдения, или, как говорят, показывают центральную тенденцию распределения.
Показатели вариации (изменчивости) (measures of variability)	
Статистики, показывающие меру разброса (вариабельность) значений переменной.
Показатели формы распределения
Описание слайда:
СТАТИСТИКИ, СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ ЧАСТОТ Показатели центра распределения (measures of location) Статистики, которые характеризуют значение признака, вокруг которого концентрируются наблюдения, или, как говорят, показывают центральную тенденцию распределения. Показатели вариации (изменчивости) (measures of variability) Статистики, показывающие меру разброса (вариабельность) значений переменной. Показатели формы распределения

Слайд 8





Показатели центра распределения
Среднее арифметическое, выборочное среднее (mean)
Эта величина получается делением суммы всех имеющихся значений переменной на количество значений
Мода (mode)	
Значение переменной, которое чаще всего встречается в выборочном распределении.
Медиана (median)	
Значение переменной, которое приходится на середину распределения частот, т.е. одна половина всех значений больше медианы, а другая — меньше
Описание слайда:
Показатели центра распределения Среднее арифметическое, выборочное среднее (mean) Эта величина получается делением суммы всех имеющихся значений переменной на количество значений Мода (mode) Значение переменной, которое чаще всего встречается в выборочном распределении. Медиана (median) Значение переменной, которое приходится на середину распределения частот, т.е. одна половина всех значений больше медианы, а другая — меньше

Слайд 9





Показатели вариации (изменчивости)
Размах вариации (range)
Разность между наибольшим и наименьшим значениями переменной в вариационном ряду
Межквартильный размах (interquartile range) 	
Размах вариации распределения, охватывающий центральные 50% всех наблюдений
Дисперсия (variance) 	
Среднее из квадратов отклонений переменной от ее средней величины
Среднеквадратичное (стандартное) отклонение (standard deviation)
Корень квадратный из значения дисперсии
Описание слайда:
Показатели вариации (изменчивости) Размах вариации (range) Разность между наибольшим и наименьшим значениями переменной в вариационном ряду Межквартильный размах (interquartile range) Размах вариации распределения, охватывающий центральные 50% всех наблюдений Дисперсия (variance) Среднее из квадратов отклонений переменной от ее средней величины Среднеквадратичное (стандартное) отклонение (standard deviation) Корень квадратный из значения дисперсии

Слайд 10





Показатели формы распределения
Асимметрия, скошенность вариационного ряда (skewness)
Характеристика распределения, с помощью которой оценивается симметрия расположения значений переменной относительно средней.
Эксцесс (kurtosis)	
Мера относительной крутости кривой распределения
Описание слайда:
Показатели формы распределения Асимметрия, скошенность вариационного ряда (skewness) Характеристика распределения, с помощью которой оценивается симметрия расположения значений переменной относительно средней. Эксцесс (kurtosis) Мера относительной крутости кривой распределения

Слайд 11





ОБЩАЯ СХЕМА ПРОВЕРКИ ГИПОТЕЗЫ
Описание слайда:
ОБЩАЯ СХЕМА ПРОВЕРКИ ГИПОТЕЗЫ

Слайд 12





КЛАССИФИКАЦИЯ ТИПОВ ПРОВЕРКИ ГИПОТЕЗЫ
Описание слайда:
КЛАССИФИКАЦИЯ ТИПОВ ПРОВЕРКИ ГИПОТЕЗЫ

Слайд 13





СХЕМА ПРОВЕРКИ ГИПОТЕЗЫ
Описание слайда:
СХЕМА ПРОВЕРКИ ГИПОТЕЗЫ

Слайд 14





ПОСТРОЕНИЕ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ
Кросс-табуляция представляет собой процесс объединения распределений час­тот значений двух или больше переменных в одну таблицу. Она объясняет, как одна переменная, например лояльность по отношению к торговой марке, связана с дру­гой переменной, такой как пол.
Описание слайда:
ПОСТРОЕНИЕ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ Кросс-табуляция представляет собой процесс объединения распределений час­тот значений двух или больше переменных в одну таблицу. Она объясняет, как одна переменная, например лояльность по отношению к торговой марке, связана с дру­гой переменной, такой как пол.

Слайд 15





ПРИЧИНЫ ПОСТРОЕНИЯ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ
менеджеры, которые недостаточно владеют статистическими методами, легко интерпретируют и понимают процедуру кросс-табуляции и ее результаты;
 очевидность трактовки результатов анализа ясно свидетельствует о возможных управленческих действиях;
 ряд операций кросс-табуляции позволяет лучше понять сложное явление, чем это сделал бы один многовариантный анализ;
 кросс-табуляция облегчает проблему разбросанных ячеек, которая затрудняет дискретный многовариантный анализ;
 анализ методом кросс-табуляции прост для выполнения и поэтому охотно ис­пользуется исследователями, менее искушенными в вопросах математической статистики
Описание слайда:
ПРИЧИНЫ ПОСТРОЕНИЯ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ менеджеры, которые недостаточно владеют статистическими методами, легко интерпретируют и понимают процедуру кросс-табуляции и ее результаты; очевидность трактовки результатов анализа ясно свидетельствует о возможных управленческих действиях; ряд операций кросс-табуляции позволяет лучше понять сложное явление, чем это сделал бы один многовариантный анализ; кросс-табуляция облегчает проблему разбросанных ячеек, которая затрудняет дискретный многовариантный анализ; анализ методом кросс-табуляции прост для выполнения и поэтому охотно ис­пользуется исследователями, менее искушенными в вопросах математической статистики

Слайд 16





Таблицы сопряженности признаков 
Наиболее часто употребляются таблиц сопряженности для 
двух и 
трех 
переменных
Описание слайда:
Таблицы сопряженности признаков Наиболее часто употребляются таблиц сопряженности для двух и трех переменных

Слайд 17





Кросс-табуляция с двумя переменными 
Общее правило, которое необходимо соблюдать, гласит: проценты необходимо вычислять для каждой категории независимой переменной (так, чтобы суммарное значение категорий зависимой переменной применительно к каждой категории независимой переменной давало 100%).
Описание слайда:
Кросс-табуляция с двумя переменными Общее правило, которое необходимо соблюдать, гласит: проценты необходимо вычислять для каждой категории независимой переменной (так, чтобы суммарное значение категорий зависимой переменной применительно к каждой категории независимой переменной давало 100%).

Слайд 18





Кросс-табуляция с тремя переменными 
Третья пе­ременная может предоставить четыре возможности:
 Уточнить связь, наблюдаемую между двумя исходными переменными.
 Указать на отсутствие связи между двумя переменными, хотя первоначально связь наблюдалась. Другими словами, третья переменная покажет, что исход­ная связь между двумя переменными была ложной.
 Показать некоторую связь между двумя переменными, хотя первоначально она не наблюдалась. В этом случае третья переменная показывает скрытую связь между первыми двумя переменными.
Не показать никаких изменений в первоначальной связи
Описание слайда:
Кросс-табуляция с тремя переменными Третья пе­ременная может предоставить четыре возможности: Уточнить связь, наблюдаемую между двумя исходными переменными. Указать на отсутствие связи между двумя переменными, хотя первоначально связь наблюдалась. Другими словами, третья переменная покажет, что исход­ная связь между двумя переменными была ложной. Показать некоторую связь между двумя переменными, хотя первоначально она не наблюдалась. В этом случае третья переменная показывает скрытую связь между первыми двумя переменными. Не показать никаких изменений в первоначальной связи

Слайд 19





Кросс-табуляция с тремя переменными
Описание слайда:
Кросс-табуляция с тремя переменными

Слайд 20





Кросс-табуляция с тремя переменными – связь уточнена
Описание слайда:
Кросс-табуляция с тремя переменными – связь уточнена

Слайд 21





Кросс-табуляция с тремя переменными – связь ложна
Описание слайда:
Кросс-табуляция с тремя переменными – связь ложна

Слайд 22





Кросс-табуляция с тремя переменными – обнаружена связь
Описание слайда:
Кросс-табуляция с тремя переменными – обнаружена связь

Слайд 23





Кросс-табуляция с тремя переменными – связь без изменений
Описание слайда:
Кросс-табуляция с тремя переменными – связь без изменений

Слайд 24





СТАТИСТИКИ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ
Критерий хи-квадрат
Фи-коэффициент
Коэффициент сопряженности признаков
V -коэффициент Крамера
Коэффициент “лямбда”
Другие статистики (tau b; tau с; gamma…)
Описание слайда:
СТАТИСТИКИ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ Критерий хи-квадрат Фи-коэффициент Коэффициент сопряженности признаков V -коэффициент Крамера Коэффициент “лямбда” Другие статистики (tau b; tau с; gamma…)

Слайд 25





Критерий хи-квадрат
Проверка зависимости между переменными с помощью критерия χ2
Описание слайда:
Критерий хи-квадрат Проверка зависимости между переменными с помощью критерия χ2

Слайд 26





Критерий хи-квадрат
Проверка нулевой гипотезы выполняется вычислением частот распределения признаков анализируемых переменных в ячейках таблицы, которые можно было бы ожидать, если бы не существовало зависимости между переменными, и при данных итоговых числах в каждом ряду и колонке.
Ожидаемые частоты, обозначаемые fe, сравнивают с фактически наблюдаемыми частотами распределения признаков.
Чем больше разница между ожидаемыми и фактическими частотами, тем выше значение статистики. 
Чтобы определить, существует ли между переменными систематическая связь, определяют вероятность получения значения χ2, равного или большего, чем рассчи­танное из таблицы сопряженности.
Описание слайда:
Критерий хи-квадрат Проверка нулевой гипотезы выполняется вычислением частот распределения признаков анализируемых переменных в ячейках таблицы, которые можно было бы ожидать, если бы не существовало зависимости между переменными, и при данных итоговых числах в каждом ряду и колонке. Ожидаемые частоты, обозначаемые fe, сравнивают с фактически наблюдаемыми частотами распределения признаков. Чем больше разница между ожидаемыми и фактическими частотами, тем выше значение статистики. Чтобы определить, существует ли между переменными систематическая связь, определяют вероятность получения значения χ2, равного или большего, чем рассчи­танное из таблицы сопряженности.

Слайд 27





Фи-коэффициент
Фи-квадрат принимает значение, равное 0, если связь отсутствует, на что также ука­зывает и значение хи-квадрат, равное 0. 
При сильной связи между переменными фи- коэффициент имеет значение 1 и все наблюдения находятся на главной или второ­степенной диагонали. 
(В некоторых компьютерных программах фи-коэффициент принимает значение —1, а не +1, когда наблюдается отрицательная связь.)
Описание слайда:
Фи-коэффициент Фи-квадрат принимает значение, равное 0, если связь отсутствует, на что также ука­зывает и значение хи-квадрат, равное 0. При сильной связи между переменными фи- коэффициент имеет значение 1 и все наблюдения находятся на главной или второ­степенной диагонали. (В некоторых компьютерных программах фи-коэффициент принимает значение —1, а не +1, когда наблюдается отрицательная связь.)

Слайд 28





V -коэффициент Крамера
V-коэффициент Крамера получают корректировкой фи-коэффициента по количеству или строк, или колонок в таблице. Причем из двух значений выбирают меньшее. 
Корректировку осуществляют так, что значения V-коэффициен­та лежат в диапазоне от 0 до 1. Большее значение V-коэффициента указывает на более сильную связь, но не указывает, как связаны переменные.
Описание слайда:
V -коэффициент Крамера V-коэффициент Крамера получают корректировкой фи-коэффициента по количеству или строк, или колонок в таблице. Причем из двух значений выбирают меньшее. Корректировку осуществляют так, что значения V-коэффициен­та лежат в диапазоне от 0 до 1. Большее значение V-коэффициента указывает на более сильную связь, но не указывает, как связаны переменные.

Слайд 29





Коэффициент “лямбда”
Коэффициент “лямбда” используется в том случае, когда переменные измерены с помощью номинальной шкалы. 
Значения коэффициента “лямбда” лежат в пределах от 0 до 1.
Значение “лямб­да”, равное 0, означает, что никакого улучшения в прогнозировании не наблюдается. Значение 1 указывает на то, что прогноз может быть сделан без ошибки. Это проис­ходит тогда, когда каждая категория независимой переменной связана с одной кате­горией зависимой переменной.
Также рассчитывают симметричный коэффициент “лямбда” (symmetric lambda) — средним значением двух асимметричных значений
Описание слайда:
Коэффициент “лямбда” Коэффициент “лямбда” используется в том случае, когда переменные измерены с помощью номинальной шкалы. Значения коэффициента “лямбда” лежат в пределах от 0 до 1. Значение “лямб­да”, равное 0, означает, что никакого улучшения в прогнозировании не наблюдается. Значение 1 указывает на то, что прогноз может быть сделан без ошибки. Это проис­ходит тогда, когда каждая категория независимой переменной связана с одной кате­горией зависимой переменной. Также рассчитывают симметричный коэффициент “лямбда” (symmetric lambda) — средним значением двух асимметричных значений

Слайд 30





Другие статистики таблиц сопряженности признаков 
(tau b; tau с; gamma…)
Для измерения связи между двумя порядковыми переменными применяют другие статистики, такие как may b, may с и гамма. 
Все эти статистики используют информацию об упорядочении категорий переменных, рас­сматривая каждую возможную пару случаев в таблице, чтобы определить, имеет ли первая переменная тот же относительный порядок расположения (ранг), что и вторая (конкордатное, согласованное расположение), или их расположения (ранги) имеют об­ратный порядок (несогласованное расположение), или их ранги совпадают (связанные ранги). 
Эти статистики отличаются только способом обработки рангов. Как тау b, так и тау с, корректируют по числу связанных рангов. Тау b (tau b) больше всего подходит для квадратных таблиц, в которых количество строк и колонок равно.
Статистика “гамма” (gamma) не учитывает ни связанные ранги, ни размер табли­цы.
Описание слайда:
Другие статистики таблиц сопряженности признаков (tau b; tau с; gamma…) Для измерения связи между двумя порядковыми переменными применяют другие статистики, такие как may b, may с и гамма. Все эти статистики используют информацию об упорядочении категорий переменных, рас­сматривая каждую возможную пару случаев в таблице, чтобы определить, имеет ли первая переменная тот же относительный порядок расположения (ранг), что и вторая (конкордатное, согласованное расположение), или их расположения (ранги) имеют об­ратный порядок (несогласованное расположение), или их ранги совпадают (связанные ранги). Эти статистики отличаются только способом обработки рангов. Как тау b, так и тау с, корректируют по числу связанных рангов. Тау b (tau b) больше всего подходит для квадратных таблиц, в которых количество строк и колонок равно. Статистика “гамма” (gamma) не учитывает ни связанные ранги, ни размер табли­цы.

Слайд 31





ПРАКТИКА ПОСТРОЕНИЯ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ
На практике кросс-табуляцию полезно вести по следующим этапам.
 Проверьте нулевую гипотезу о том, что отсутствует связь между переменными, используя критерий хи-квадрат. Если вам не удалось отклонить нулевую гипо­тезу, то связь между переменными отсутствует.
 Если нулевая гипотеза H0 отклонена, то определите тесноту связи, используя подходящие статистики (фи-коэффициент, коэффициент сопряженности, V-коэффициент Крамера, коэффициент “лямбда” или другие статистики).
 Если нулевая гипотеза H0 отклонена, то поясните характер связи, вычислив процентные значения зависимой переменной для каждой из категорий неза­висимой переменной.
 Если анализируются порядковые переменные, то используйте в качестве про­верочных статистик тау b, тау с или “гамму”. Если нулевая гипотеза Н0 откло­нена, то определите тесноту связи, используя величину и направление связи, а также учитывая знак проверяемой статистики.
Описание слайда:
ПРАКТИКА ПОСТРОЕНИЯ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ На практике кросс-табуляцию полезно вести по следующим этапам. Проверьте нулевую гипотезу о том, что отсутствует связь между переменными, используя критерий хи-квадрат. Если вам не удалось отклонить нулевую гипо­тезу, то связь между переменными отсутствует. Если нулевая гипотеза H0 отклонена, то определите тесноту связи, используя подходящие статистики (фи-коэффициент, коэффициент сопряженности, V-коэффициент Крамера, коэффициент “лямбда” или другие статистики). Если нулевая гипотеза H0 отклонена, то поясните характер связи, вычислив процентные значения зависимой переменной для каждой из категорий неза­висимой переменной. Если анализируются порядковые переменные, то используйте в качестве про­верочных статистик тау b, тау с или “гамму”. Если нулевая гипотеза Н0 откло­нена, то определите тесноту связи, используя величину и направление связи, а также учитывая знак проверяемой статистики.

Слайд 32





ПРОВЕРКА ГИПОТЕЗ: РАЗЛИЧИЯ МЕЖДУ ЗНАЧЕНИЯМИ ПЕРЕМЕННЫХ
Описание слайда:
ПРОВЕРКА ГИПОТЕЗ: РАЗЛИЧИЯ МЕЖДУ ЗНАЧЕНИЯМИ ПЕРЕМЕННЫХ

Слайд 33





ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
Использование параметрических критериев позволяет сделать статистический вывод относительно среднего значения генеральной совокупности. 
Обычно для этой цели используют t-критерий (t-test). В основе критерия лежит t-статистика Стьюдента (Student).
Описание слайда:
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Использование параметрических критериев позволяет сделать статистический вывод относительно среднего значения генеральной совокупности. Обычно для этой цели используют t-критерий (t-test). В основе критерия лежит t-статистика Стьюдента (Student).

Слайд 34





Процедура проверки гипотезы методом t-критерия:
Сформулировать нулевую (H0) и альтернативную (H,) гипотезы.
Выбрать соответствующую формулу для вычисления t-статистики.
Выбрать уровень значимости а для проверки нулевой гипотезы H0. Обычно выбирают уровень значимости а, равный 0,05.
Взять одну или две выборки и для каждой вычислить значение средней и стан­дартное отклонение.
Вычислить значение t-статистики, приняв, что нулевая гипотеза H0 верна.
Вычислить число степеней свободы и оценить вероятность получения большего значения статистики. (Альтернативно, вычислить критическое значение t-статистики.)
Если вероятность, рассчитанная на этапе 6, меньше, чем уровень значимости H0, выбранный на этапе 3, то отклонить нулевую гипотезу (H0). Если значе­ние вероятности больше, то H0 не отклонять. (Альтернативно, если значение вычисленной на этапе 5 t-статистики больше критического значения, опреде­ленного на этапе 6, то отклонить нулевую гипотезу H0. Если вычисленное зна­чение меньше критического значения, то H0 не следует отклонять.) Неудачная попытка отклонить нулевую гипотезу только означает, что истинное положение несущественно (статис­тически незначимо) отличается от положения H0.
Выразить полученный результат в виде, пригодном для решения проблемы маркетингового исследования.
Описание слайда:
Процедура проверки гипотезы методом t-критерия: Сформулировать нулевую (H0) и альтернативную (H,) гипотезы. Выбрать соответствующую формулу для вычисления t-статистики. Выбрать уровень значимости а для проверки нулевой гипотезы H0. Обычно выбирают уровень значимости а, равный 0,05. Взять одну или две выборки и для каждой вычислить значение средней и стан­дартное отклонение. Вычислить значение t-статистики, приняв, что нулевая гипотеза H0 верна. Вычислить число степеней свободы и оценить вероятность получения большего значения статистики. (Альтернативно, вычислить критическое значение t-статистики.) Если вероятность, рассчитанная на этапе 6, меньше, чем уровень значимости H0, выбранный на этапе 3, то отклонить нулевую гипотезу (H0). Если значе­ние вероятности больше, то H0 не отклонять. (Альтернативно, если значение вычисленной на этапе 5 t-статистики больше критического значения, опреде­ленного на этапе 6, то отклонить нулевую гипотезу H0. Если вычисленное зна­чение меньше критического значения, то H0 не следует отклонять.) Неудачная попытка отклонить нулевую гипотезу только означает, что истинное положение несущественно (статис­тически незначимо) отличается от положения H0. Выразить полученный результат в виде, пригодном для решения проблемы маркетингового исследования.

Слайд 35





Проверка гипотезы методом t-критерия для одной выборки:
Проверка утверждений о со­отношении значения одной переменной по сравнению с известной или заданной величиной
Эти утверждения сфор­мулируем с точки зрения нулевой гипотезы, которую затем проверим, используя статистический критерий для одной выборки, такой как t- или z-критерий. Если маркетолог использует t-критерий для проверки значения средней, его интересует, совпадает ли значение генеральной средней со значением, задаваемым в утверж­дении нулевой гипотезы (H0).
Если известно стандартное отклонение ГС и используем его, то лучше использовать z-критерий (z-test).
Описание слайда:
Проверка гипотезы методом t-критерия для одной выборки: Проверка утверждений о со­отношении значения одной переменной по сравнению с известной или заданной величиной Эти утверждения сфор­мулируем с точки зрения нулевой гипотезы, которую затем проверим, используя статистический критерий для одной выборки, такой как t- или z-критерий. Если маркетолог использует t-критерий для проверки значения средней, его интересует, совпадает ли значение генеральной средней со значением, задаваемым в утверж­дении нулевой гипотезы (H0). Если известно стандартное отклонение ГС и используем его, то лучше использовать z-критерий (z-test).

Слайд 36





Проверка гипотезы методом t-критерия для двух независимых выборок:
Как и для одной выборки, проверка гипотез может проводиться относительно значений средних или долей:
Средние. Если неизвестно, равны ли дисперсии двух совокупностей, то для проверки вы­борочной дисперсии используем F-критерий, или критерий Фишера (F-test):
Описание слайда:
Проверка гипотезы методом t-критерия для двух независимых выборок: Как и для одной выборки, проверка гипотез может проводиться относительно значений средних или долей: Средние. Если неизвестно, равны ли дисперсии двух совокупностей, то для проверки вы­борочной дисперсии используем F-критерий, или критерий Фишера (F-test):

Слайд 37





Проверка гипотезы методом t-критерия для двух независимых выборок:
Доли. Для одной выборки используют z-критерий.
Если вычисленное значение меньше, чем критическое, нулевую гипотезу не­льзя отклонить.
Описание слайда:
Проверка гипотезы методом t-критерия для двух независимых выборок: Доли. Для одной выборки используют z-критерий. Если вычисленное значение меньше, чем критическое, нулевую гипотезу не­льзя отклонить.

Слайд 38





Проверка гипотезы методом t-критерия для парных выборок:
Различие, возникающее в этой ситуации, проверяют с помощью t-критерия парных выборок (paired samples t-test).
Чтобы вычислить значение t-критерия для парных выборок, вводят переменную разности, обозначаемую D, и вычисляют ее среднее и дисперсию. После этого вы­числяют t-статистику :
Описание слайда:
Проверка гипотезы методом t-критерия для парных выборок: Различие, возникающее в этой ситуации, проверяют с помощью t-критерия парных выборок (paired samples t-test). Чтобы вычислить значение t-критерия для парных выборок, вводят переменную разности, обозначаемую D, и вычисляют ее среднее и дисперсию. После этого вы­числяют t-статистику :

Слайд 39





НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ ПРОВЕРКИ ГИПОТЕЗ для одной выборки
Критерий согласия Колмогорова-Смирнова для одной выборки (Kolmogorov—Smirnov (К—S) one-sample test) - Непараметрический метод проверки степени согласия эмпирической функции распределения переменной с определенным теоретическим законом распределения. (Чем больше значение К, тем больше уверенности, что нулевая гипотеза (H0) неверна);
можно выполнять проверку гипотезы по критерию хи-квадрат;
Биномиальный критерий (binomial test) - Статистический критерий согласия для дихотомических переменных. Он проверяет степень согласия наблюдаемого количества наблюдений в каждой категории с количеством наблюдений, ожидаемым в условиях конкретного биномиального распределения (для дихото­мических (двузначных) переменных)
Описание слайда:
НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ ПРОВЕРКИ ГИПОТЕЗ для одной выборки Критерий согласия Колмогорова-Смирнова для одной выборки (Kolmogorov—Smirnov (К—S) one-sample test) - Непараметрический метод проверки степени согласия эмпирической функции распределения переменной с определенным теоретическим законом распределения. (Чем больше значение К, тем больше уверенности, что нулевая гипотеза (H0) неверна); можно выполнять проверку гипотезы по критерию хи-квадрат; Биномиальный критерий (binomial test) - Статистический критерий согласия для дихотомических переменных. Он проверяет степень согласия наблюдаемого количества наблюдений в каждой категории с количеством наблюдений, ожидаемым в условиях конкретного биномиального распределения (для дихото­мических (двузначных) переменных)

Слайд 40





НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ ПРОВЕРКИ ГИПОТЕЗ для двух независимых выборок :
U-критерий Манна—Уитни (Mann—Whitney U-test) - Статистический критерий для переменной, измеренной с помощью порядковой шкалы, который сравнивает различие в показателях положения двух совокупностей исходя из наблюдений, взятых из двух независимых выборок.;
Двухвыборочный медианный критерий (two-sample median test)  - Непараметрический метод проверки, который определяет, действительно ли две группы взяты из совокупностей с одной и той же медианой. (не столь мощный, как U-критерий Манна—Уитни);
(Kolmogorov-Smirnov two-sample test) - Непараметрический метод проверки того, действительно ли два распределения являются одинаковыми. Этот критерий учитывает любые различия между двумя распределениями, включая медиану, вариацию и асимметрию.
Описание слайда:
НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ ПРОВЕРКИ ГИПОТЕЗ для двух независимых выборок : U-критерий Манна—Уитни (Mann—Whitney U-test) - Статистический критерий для переменной, измеренной с помощью порядковой шкалы, который сравнивает различие в показателях положения двух совокупностей исходя из наблюдений, взятых из двух независимых выборок.; Двухвыборочный медианный критерий (two-sample median test) - Непараметрический метод проверки, который определяет, действительно ли две группы взяты из совокупностей с одной и той же медианой. (не столь мощный, как U-критерий Манна—Уитни); (Kolmogorov-Smirnov two-sample test) - Непараметрический метод проверки того, действительно ли два распределения являются одинаковыми. Этот критерий учитывает любые различия между двумя распределениями, включая медиану, вариацию и асимметрию.

Слайд 41





НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ ПРОВЕРКИ ГИПОТЕЗ для парных выборок:
Критерий попарных сравнений Вилкоксона (Wilcoxon matched-pairs signed-ranks test) - Непараметрический метод проверки, с помощью которого анализируют разности между парными наблюдениями, учитывая их величину;
Критерий знаков (sign test) - Непараметрический критерий для изучения разностей в показателях центральной тенденции двух генеральных совокупностей на основе парных наблюдений, который только сравнивает знаки разностей между парами переменных, но не учитывает величину разностей. (не столь мощный, как критерий Вилкоксона);
Иногда возможно использовать критерий Мак-Немара/ критерий хи-квадрат.
Описание слайда:
НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ ПРОВЕРКИ ГИПОТЕЗ для парных выборок: Критерий попарных сравнений Вилкоксона (Wilcoxon matched-pairs signed-ranks test) - Непараметрический метод проверки, с помощью которого анализируют разности между парными наблюдениями, учитывая их величину; Критерий знаков (sign test) - Непараметрический критерий для изучения разностей в показателях центральной тенденции двух генеральных совокупностей на основе парных наблюдений, который только сравнивает знаки разностей между парами переменных, но не учитывает величину разностей. (не столь мощный, как критерий Вилкоксона); Иногда возможно использовать критерий Мак-Немара/ критерий хи-квадрат.

Слайд 42





Спасибо за внимание!
Описание слайда:
Спасибо за внимание!



Похожие презентации
Mypresentation.ru
Загрузить презентацию