🗊Презентация Анализ эмпирических данных. (Тема 9)

Категория: Математика
Нажмите для полного просмотра!
Анализ эмпирических данных. (Тема 9), слайд №1Анализ эмпирических данных. (Тема 9), слайд №2Анализ эмпирических данных. (Тема 9), слайд №3Анализ эмпирических данных. (Тема 9), слайд №4Анализ эмпирических данных. (Тема 9), слайд №5Анализ эмпирических данных. (Тема 9), слайд №6Анализ эмпирических данных. (Тема 9), слайд №7Анализ эмпирических данных. (Тема 9), слайд №8Анализ эмпирических данных. (Тема 9), слайд №9Анализ эмпирических данных. (Тема 9), слайд №10Анализ эмпирических данных. (Тема 9), слайд №11Анализ эмпирических данных. (Тема 9), слайд №12Анализ эмпирических данных. (Тема 9), слайд №13Анализ эмпирических данных. (Тема 9), слайд №14

Вы можете ознакомиться и скачать презентацию на тему Анализ эмпирических данных. (Тема 9). Доклад-сообщение содержит 14 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





АНАЛИЗ ЭМПИРИЧЕСКИХ ДАННЫХ
Описание слайда:
АНАЛИЗ ЭМПИРИЧЕСКИХ ДАННЫХ

Слайд 2





Виды анализа данных
Эмпирические данные могут быть представлены в виде:
совокупности чисел, характеризующих те или иные объекты;
множества индикаторов определенных отношений между рассматриваемыми объектами; 
результатов попарных сравнений респондентами каких-либо объектов;
совокупности определенных высказываний (например, при ответе респондентов на открытые вопросы);
текстов документов;
так или иначе зафиксированных результатов наблюдения за невербальным поведением каких-либо людей и т.п.
Описание слайда:
Виды анализа данных Эмпирические данные могут быть представлены в виде: совокупности чисел, характеризующих те или иные объекты; множества индикаторов определенных отношений между рассматриваемыми объектами; результатов попарных сравнений респондентами каких-либо объектов; совокупности определенных высказываний (например, при ответе респондентов на открытые вопросы); текстов документов; так или иначе зафиксированных результатов наблюдения за невербальным поведением каких-либо людей и т.п.

Слайд 3





Группировка,  табулирование и представление данных
До начала анализа данные необходимо сгруппировать, упорядочить по одному признаку. Когда данные сгруппированы, по каждой группе устанавливается ее абсолютная частота (число наблюдений в данной выборке) и относительная частота (т.е. доля каждой группы в общей массе наблюдений). Результаты представляют в виде таблицы частотного распределения для каждой переменной.
Таблица 1.
Описание слайда:
Группировка, табулирование и представление данных До начала анализа данные необходимо сгруппировать, упорядочить по одному признаку. Когда данные сгруппированы, по каждой группе устанавливается ее абсолютная частота (число наблюдений в данной выборке) и относительная частота (т.е. доля каждой группы в общей массе наблюдений). Результаты представляют в виде таблицы частотного распределения для каждой переменной. Таблица 1.

Слайд 4





Графическое представление данных
Круговая диаграмма
Описание слайда:
Графическое представление данных Круговая диаграмма

Слайд 5





Графики связи двух и более переменных
Динамика набора студентов НШФ ЮФУ
Описание слайда:
Графики связи двух и более переменных Динамика набора студентов НШФ ЮФУ

Слайд 6





Группировка
В примере с двумя вариантами значений переменной (пол: либо мужской, либо женский) производить вычисления и строить частотные распределения достаточно легко. В случае же, если таких значений много (например, 200 респондентов указывают свой возраст в годах: количество вариантов может быть порядка 50-70, в зависимости от того, кто попал в выборку), для облегчения работы с частотными распределениями, используют группировку и обобщение, а также обобщающие числовые значения – статистики. 
Группировка:
Сгруппировать данные о возрасте респондентов: 20,20,21,22,22,23,25,26,27,28,28,29,30,32,33,34,34,35,35,35,36,37,38,39,40,40,40,41,42,43,44,44,45,47,48,49: в две, три, шесть групп.
Описание слайда:
Группировка В примере с двумя вариантами значений переменной (пол: либо мужской, либо женский) производить вычисления и строить частотные распределения достаточно легко. В случае же, если таких значений много (например, 200 респондентов указывают свой возраст в годах: количество вариантов может быть порядка 50-70, в зависимости от того, кто попал в выборку), для облегчения работы с частотными распределениями, используют группировку и обобщение, а также обобщающие числовые значения – статистики. Группировка: Сгруппировать данные о возрасте респондентов: 20,20,21,22,22,23,25,26,27,28,28,29,30,32,33,34,34,35,35,35,36,37,38,39,40,40,40,41,42,43,44,44,45,47,48,49: в две, три, шесть групп.

Слайд 7





Статистики 
Наибольшее значение имеют две группы статистик: меры центральной тенденции и меры изменчивости (разброса).

Меры центральной тенденции
Описание слайда:
Статистики Наибольшее значение имеют две группы статистик: меры центральной тенденции и меры изменчивости (разброса). Меры центральной тенденции

Слайд 8





Меры центральной тенденции
1. Мода (Мо) - значение наблюдений, которое встречается наиболее часто. Например, группа респондентов указала свой возраст: 35, 24, 25, 28, 27, 30, 25, 33, 36 лет. В данном случае Мо = 25 лет (встречается дважды).  В распределении могут быть две и более моды, либо мода может отсутствовать. 
2. Медиана (Md) - это значение, которое делит упорядоченное множество данных пополам, так что одна половина наблюдений оказывается не меньше медианы, а другая – не больше. Для нахождения медианного значения для небольшого массива наблюдений упорядочивают наблюдения от меньших значений переменной к большим: то значение, которое оказывается в центре, и является медианой.
Для примера с возрастом получим:24, 25, 25, 27, 28, 30, 33, 35, 36 Мd = 28 (т.е. 4 значения (24, 25, 25, 27) – не больше 28 и 4 значения (30, 33, 35, 36) - не меньше). Если число значений в группе наблюдений четное, то медианой будет среднее двух центральных значений упорядоченной совокупности. 
3. Среднее арифметическое (X). Высчитывается путем деления суммы всех значений наблюдений на число наблюдений. Средний возраст респондентов (из приведенного примера) составит: (24 + 25 + 25 + 27 + 28 + 30 + 33 + 35 + 36)/ 9 = 29,2 года
4. Отклонением от среднего называется разность между значением отдельного признака совокупности и средним для данной совокупности
Описание слайда:
Меры центральной тенденции 1. Мода (Мо) - значение наблюдений, которое встречается наиболее часто. Например, группа респондентов указала свой возраст: 35, 24, 25, 28, 27, 30, 25, 33, 36 лет. В данном случае Мо = 25 лет (встречается дважды). В распределении могут быть две и более моды, либо мода может отсутствовать. 2. Медиана (Md) - это значение, которое делит упорядоченное множество данных пополам, так что одна половина наблюдений оказывается не меньше медианы, а другая – не больше. Для нахождения медианного значения для небольшого массива наблюдений упорядочивают наблюдения от меньших значений переменной к большим: то значение, которое оказывается в центре, и является медианой. Для примера с возрастом получим:24, 25, 25, 27, 28, 30, 33, 35, 36 Мd = 28 (т.е. 4 значения (24, 25, 25, 27) – не больше 28 и 4 значения (30, 33, 35, 36) - не меньше). Если число значений в группе наблюдений четное, то медианой будет среднее двух центральных значений упорядоченной совокупности. 3. Среднее арифметическое (X). Высчитывается путем деления суммы всех значений наблюдений на число наблюдений. Средний возраст респондентов (из приведенного примера) составит: (24 + 25 + 25 + 27 + 28 + 30 + 33 + 35 + 36)/ 9 = 29,2 года 4. Отклонением от среднего называется разность между значением отдельного признака совокупности и средним для данной совокупности

Слайд 9





Меры изменчивости, разброса
1. Размах - описывает диапазон изменчивости значений. Так, в примере с возрастом размах = 36-24=12 лет
2. Коэффициент вариации (V) - процент наблюдений, не совпадающих с модальным значением. В нашем примере от модального отличаются 78 % значений, значит V=78 % (или V=0,78).
3. Дисперсия. Представительную информацию о вариации совокупности значений относительно среднего дают отклонения от среднего. Однако, поскольку сумма всех значений отклонения равна нулю (основное свойство средних), то в данном случае используют квадраты отклонений, вернее, их сумму. (Если  данные однородны, то сумма квадратов отклонений будет маленькой,  и, наоборот, когда данные неоднородны – большой). Для возможности сравнения сумм квадратов отклонений выборок разного размера каждую из них делят на N, где N - объем выборки. Полученная величина называется дисперсией (S2).  (методичка с.45)
4. Стандартное отклонение. Величина, равная квадратному корню из дисперсии, называется стандартным отклонением (s). Для небольших выборок (N< 100) лучше делить на (N-1). (методичка с.45)
Самое главное значение стандартного отклонения - продемонстрировать «типичность» среднего: чем оно меньше, тем с большей вероятностью можно говорить, что среднее представительно для данной совокупности наблюдений.
Описание слайда:
Меры изменчивости, разброса 1. Размах - описывает диапазон изменчивости значений. Так, в примере с возрастом размах = 36-24=12 лет 2. Коэффициент вариации (V) - процент наблюдений, не совпадающих с модальным значением. В нашем примере от модального отличаются 78 % значений, значит V=78 % (или V=0,78). 3. Дисперсия. Представительную информацию о вариации совокупности значений относительно среднего дают отклонения от среднего. Однако, поскольку сумма всех значений отклонения равна нулю (основное свойство средних), то в данном случае используют квадраты отклонений, вернее, их сумму. (Если данные однородны, то сумма квадратов отклонений будет маленькой, и, наоборот, когда данные неоднородны – большой). Для возможности сравнения сумм квадратов отклонений выборок разного размера каждую из них делят на N, где N - объем выборки. Полученная величина называется дисперсией (S2). (методичка с.45) 4. Стандартное отклонение. Величина, равная квадратному корню из дисперсии, называется стандартным отклонением (s). Для небольших выборок (N< 100) лучше делить на (N-1). (методичка с.45) Самое главное значение стандартного отклонения - продемонстрировать «типичность» среднего: чем оно меньше, тем с большей вероятностью можно говорить, что среднее представительно для данной совокупности наблюдений.

Слайд 10





Практическое задание
Рассчитать статистики для данных о возрасте:
20,20,21,22,22,23,25,26,27,28,28,29,30,32,33,34,34,35,35,35,36,37,38,39,40,40,40,41,42,43,44,44,45,47,48,49: 
Мода
Медиана
Среднее арифметическое
Отклонение от среднего  для 20 и 49 (25, 35 и 45)
Размах
Коэффициент вариации
Описание слайда:
Практическое задание Рассчитать статистики для данных о возрасте: 20,20,21,22,22,23,25,26,27,28,28,29,30,32,33,34,34,35,35,35,36,37,38,39,40,40,40,41,42,43,44,44,45,47,48,49: Мода Медиана Среднее арифметическое Отклонение от среднего для 20 и 49 (25, 35 и 45) Размах Коэффициент вариации

Слайд 11





Проверка результатов
 20,20,21,22,22,23,25,26,27,28,28,29,30,32,33,34,34,35,35,35,36,37,38,39,40,40,40,41,42,43,44,44,45,47,48,49: 
Мода – 35 и 40
Медиана - 35
Среднее арифметическое – 33,86 (39)
Отклонение от среднего 1й – 13,86 / 36й – 15,14
Размах - 29
Коэффициент вариации – 83,6 %
Описание слайда:
Проверка результатов 20,20,21,22,22,23,25,26,27,28,28,29,30,32,33,34,34,35,35,35,36,37,38,39,40,40,40,41,42,43,44,44,45,47,48,49: Мода – 35 и 40 Медиана - 35 Среднее арифметическое – 33,86 (39) Отклонение от среднего 1й – 13,86 / 36й – 15,14 Размах - 29 Коэффициент вариации – 83,6 %

Слайд 12





Рассчитать статистики, в том числе дисперсию и стандартное отклонение
За 2011 год Ира посетила драматический театр 2 раза, Света 3 раза, Юля 5 раз, Лена 6 раз.
Мода
Медиана
Среднее арифметическое
Размах
Коэффициент вариации
Дисперсия
Стандартное отклонение
Описание слайда:
Рассчитать статистики, в том числе дисперсию и стандартное отклонение За 2011 год Ира посетила драматический театр 2 раза, Света 3 раза, Юля 5 раз, Лена 6 раз. Мода Медиана Среднее арифметическое Размах Коэффициент вариации Дисперсия Стандартное отклонение

Слайд 13





Анализ связи между двумя переменными
При всей важности одномерного анализа в исследованиях основное внимание обычно уделяется анализу связей между переменными, поскольку именно это позволяет делать выводы о причинно-следственных связях, подтверждать или опровергать выдвинутые гипотезы. Самым распространенным является анализ взаимосвязи (сопряженности) двух переменных. 
Первым этапом этого процесса является перекрестная классификация, или построение таблицы сопряженности признаков (т.е. исследователю необходимо проследить информацию о совместном появлении переменных).
См. методичку с. 88-89-90.
Описание слайда:
Анализ связи между двумя переменными При всей важности одномерного анализа в исследованиях основное внимание обычно уделяется анализу связей между переменными, поскольку именно это позволяет делать выводы о причинно-следственных связях, подтверждать или опровергать выдвинутые гипотезы. Самым распространенным является анализ взаимосвязи (сопряженности) двух переменных. Первым этапом этого процесса является перекрестная классификация, или построение таблицы сопряженности признаков (т.е. исследователю необходимо проследить информацию о совместном появлении переменных). См. методичку с. 88-89-90.

Слайд 14





Сопряженность признаков
Описание слайда:
Сопряженность признаков



Похожие презентации
Mypresentation.ru
Загрузить презентацию