🗊Презентация Связи между двумя переменными (лекция 9)

Категория: Математика
Нажмите для полного просмотра!
Связи между двумя переменными (лекция 9), слайд №1Связи между двумя переменными (лекция 9), слайд №2Связи между двумя переменными (лекция 9), слайд №3Связи между двумя переменными (лекция 9), слайд №4Связи между двумя переменными (лекция 9), слайд №5Связи между двумя переменными (лекция 9), слайд №6Связи между двумя переменными (лекция 9), слайд №7Связи между двумя переменными (лекция 9), слайд №8Связи между двумя переменными (лекция 9), слайд №9Связи между двумя переменными (лекция 9), слайд №10Связи между двумя переменными (лекция 9), слайд №11Связи между двумя переменными (лекция 9), слайд №12Связи между двумя переменными (лекция 9), слайд №13Связи между двумя переменными (лекция 9), слайд №14Связи между двумя переменными (лекция 9), слайд №15Связи между двумя переменными (лекция 9), слайд №16Связи между двумя переменными (лекция 9), слайд №17Связи между двумя переменными (лекция 9), слайд №18Связи между двумя переменными (лекция 9), слайд №19Связи между двумя переменными (лекция 9), слайд №20Связи между двумя переменными (лекция 9), слайд №21Связи между двумя переменными (лекция 9), слайд №22Связи между двумя переменными (лекция 9), слайд №23Связи между двумя переменными (лекция 9), слайд №24Связи между двумя переменными (лекция 9), слайд №25Связи между двумя переменными (лекция 9), слайд №26Связи между двумя переменными (лекция 9), слайд №27Связи между двумя переменными (лекция 9), слайд №28Связи между двумя переменными (лекция 9), слайд №29Связи между двумя переменными (лекция 9), слайд №30Связи между двумя переменными (лекция 9), слайд №31Связи между двумя переменными (лекция 9), слайд №32Связи между двумя переменными (лекция 9), слайд №33Связи между двумя переменными (лекция 9), слайд №34Связи между двумя переменными (лекция 9), слайд №35Связи между двумя переменными (лекция 9), слайд №36Связи между двумя переменными (лекция 9), слайд №37Связи между двумя переменными (лекция 9), слайд №38Связи между двумя переменными (лекция 9), слайд №39Связи между двумя переменными (лекция 9), слайд №40Связи между двумя переменными (лекция 9), слайд №41Связи между двумя переменными (лекция 9), слайд №42Связи между двумя переменными (лекция 9), слайд №43Связи между двумя переменными (лекция 9), слайд №44Связи между двумя переменными (лекция 9), слайд №45Связи между двумя переменными (лекция 9), слайд №46Связи между двумя переменными (лекция 9), слайд №47Связи между двумя переменными (лекция 9), слайд №48Связи между двумя переменными (лекция 9), слайд №49Связи между двумя переменными (лекция 9), слайд №50Связи между двумя переменными (лекция 9), слайд №51

Содержание

Вы можете ознакомиться и скачать презентацию на тему Связи между двумя переменными (лекция 9). Доклад-сообщение содержит 51 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Лекция 9. Связи между двумя переменными 
Дмитриева Арина
admitrieva@eu.spb.ru
16 ноября, 2016
Описание слайда:
Лекция 9. Связи между двумя переменными Дмитриева Арина admitrieva@eu.spb.ru 16 ноября, 2016

Слайд 2





Двумерные связи 
Таблицы сопряженности 
Корреляция и регрессия
Описание слайда:
Двумерные связи Таблицы сопряженности Корреляция и регрессия

Слайд 3





Исследовательская модель
Будет ли назначено подсудимому реальный или условный срок в зависимости от наличия детей
Описание слайда:
Исследовательская модель Будет ли назначено подсудимому реальный или условный срок в зависимости от наличия детей

Слайд 4





Таблица сопряженности
Позволяет увидеть связи между двумя переменными 
Номинальной и номинальной
Номинальной и порядковой
Порядковой и порядковой
Таблица сопряженности (contingency table, cross-tab) – статистический метод, который отражает совместное распределение двух или больше переменных с ограниченным числом категорий
Описание слайда:
Таблица сопряженности Позволяет увидеть связи между двумя переменными Номинальной и номинальной Номинальной и порядковой Порядковой и порядковой Таблица сопряженности (contingency table, cross-tab) – статистический метод, который отражает совместное распределение двух или больше переменных с ограниченным числом категорий

Слайд 5





Таблица сопряженности
Описание слайда:
Таблица сопряженности

Слайд 6





Таблица сопряженности, %
В абсолютных цифрах таблица сопряженности неинформативна
Описание слайда:
Таблица сопряженности, % В абсолютных цифрах таблица сопряженности неинформативна

Слайд 7





Таблица сопряженности, %
Описание слайда:
Таблица сопряженности, %

Слайд 8





Таблица сопряженности между двумя порядковыми переменными
Описание слайда:
Таблица сопряженности между двумя порядковыми переменными

Слайд 9





Графическое изображение
Описание слайда:
Графическое изображение

Слайд 10





Связь между двумя метрическими переменными
Описание слайда:
Связь между двумя метрическими переменными

Слайд 11





Переменные 
Sent – размер назначенного наказания (в разных единицах: штраф – в рублях, исправительные работы или тюремное заключение – в годах и месяцах) 
Любая статья УК содержит информацию о нижней (lbound) и верхней (ubound) границе размера наказания 
Наказание может быть назначено:  
В пределах границ
Ниже или выше границ
Описание слайда:
Переменные Sent – размер назначенного наказания (в разных единицах: штраф – в рублях, исправительные работы или тюремное заключение – в годах и месяцах) Любая статья УК содержит информацию о нижней (lbound) и верхней (ubound) границе размера наказания Наказание может быть назначено: В пределах границ Ниже или выше границ

Слайд 12





Диаграмма рассеивания (интервальные данные)
Описание слайда:
Диаграмма рассеивания (интервальные данные)

Слайд 13





Корреляция между двумя переменными
Корреляция – наличие связи между двумя переменными 
Эта связь может быть прямой и обратной
Размер связи меняется от -1 до 1
Прямая связь: большему значению X соответствует большее значение Y 
Обратная: большему значению X соответствует меньшее значение Y 
Гальтон: корреляция роста родителей и детей 
Наиболее известен коэффициент линейной корреляции Пирсона r
Описание слайда:
Корреляция между двумя переменными Корреляция – наличие связи между двумя переменными Эта связь может быть прямой и обратной Размер связи меняется от -1 до 1 Прямая связь: большему значению X соответствует большее значение Y Обратная: большему значению X соответствует меньшее значение Y Гальтон: корреляция роста родителей и детей Наиболее известен коэффициент линейной корреляции Пирсона r

Слайд 14





Коэффициент корреляции Пирсона 
Каково направление и сила связи между размером наказания и возрастом? 
Относятся ли судьи мягче к молодым подсудимым? 
Строже, чтобы «не повадно было впредь»?
(гипотеза исправления и наказания)
Описание слайда:
Коэффициент корреляции Пирсона Каково направление и сила связи между размером наказания и возрастом? Относятся ли судьи мягче к молодым подсудимым? Строже, чтобы «не повадно было впредь»? (гипотеза исправления и наказания)

Слайд 15





Формула для коэффициента корреляции
Корреляция – одно число, которое объясняет линейную связь между двумя переменными
Основная формула
Корреляция – ковариация деленная на произведение соответствующих среднеквадратических отклонений
Описание слайда:
Формула для коэффициента корреляции Корреляция – одно число, которое объясняет линейную связь между двумя переменными Основная формула Корреляция – ковариация деленная на произведение соответствующих среднеквадратических отклонений

Слайд 16





Характеристики корреляции
Наклон: 
положительная 
отрицательная
Сила: 
сильная, 
слабая, 
совершенная 
Отсутствие корреляции 
Нелинейная корреляция
Описание слайда:
Характеристики корреляции Наклон: положительная отрицательная Сила: сильная, слабая, совершенная Отсутствие корреляции Нелинейная корреляция

Слайд 17





Требования 
Линейная связь между X и Y
X и Y являются метрическими переменными
X и Y являются случайными величинами (выборка должна быть репрезентативна) 
X и Y распределены нормально (но при N>30 требования к распределению снижаются)
Описание слайда:
Требования Линейная связь между X и Y X и Y являются метрическими переменными X и Y являются случайными величинами (выборка должна быть репрезентативна) X и Y распределены нормально (но при N>30 требования к распределению снижаются)

Слайд 18





Корреляция
Описание слайда:
Корреляция

Слайд 19





Регрессионная линия
Если точки на диаграмме рассеяния аппроксимируются прямой линией, то мы имеем дело с линейной регрессионной моделью
Описание слайда:
Регрессионная линия Если точки на диаграмме рассеяния аппроксимируются прямой линией, то мы имеем дело с линейной регрессионной моделью

Слайд 20





Подгонка линии 
Метод наименьших квадратов
Описание слайда:
Подгонка линии Метод наименьших квадратов

Слайд 21





Регрессионный анализ
Базовая модель линейной регрессии: 
 - точка пересечения с осью Y (значение Y, когда X равен 0)
 - наклон регрессионной линии (изменение Y в ответ на изменение X на 1 единицу), коэффициент регрессии (математически: тангенс угла, образуемого регрессионной линией и осью X)
Описание слайда:
Регрессионный анализ Базовая модель линейной регрессии: - точка пересечения с осью Y (значение Y, когда X равен 0) - наклон регрессионной линии (изменение Y в ответ на изменение X на 1 единицу), коэффициент регрессии (математически: тангенс угла, образуемого регрессионной линией и осью X)

Слайд 22





Регрессионная модель
Метод наименьших квадратов:
Регрессионный коэффициент:
Пересечение с осью ординат: 
Регрессионная линия всегда проходит через точку )
Связь между коэффициентом регрессии и коэффициентом корреляции
Описание слайда:
Регрессионная модель Метод наименьших квадратов: Регрессионный коэффициент: Пересечение с осью ординат: Регрессионная линия всегда проходит через точку ) Связь между коэффициентом регрессии и коэффициентом корреляции

Слайд 23


Связи между двумя переменными (лекция 9), слайд №23
Описание слайда:

Слайд 24






Предсказанная линия

			 
Остатки: 
Сумма квадратов остатков
Описание слайда:
Предсказанная линия Остатки: Сумма квадратов остатков

Слайд 25


Связи между двумя переменными (лекция 9), слайд №25
Описание слайда:

Слайд 26





Регрессионное уравнение 
Регрессионное уравнение зависимости размера наказания от числа предыдущих судимостей
Какой срок дадут человеку с 3 судимостями? 
Человеку с 3 судимостями дадут больше срок, чем человеку с 2 судимостями? 
Насколько? 
Сколько дадут человеку без судимостей?
Описание слайда:
Регрессионное уравнение Регрессионное уравнение зависимости размера наказания от числа предыдущих судимостей Какой срок дадут человеку с 3 судимостями? Человеку с 3 судимостями дадут больше срок, чем человеку с 2 судимостями? Насколько? Сколько дадут человеку без судимостей?

Слайд 27





Сумма квадратов 
Для проверки качества модели рассчитывают ряд стастик: 
  – общая сумма квадратов отклонений зависимой переменной от ее среднего
  – объясненная регрессией сумма квадратов отклонений
 –сумма квадратов остатков
Описание слайда:
Сумма квадратов Для проверки качества модели рассчитывают ряд стастик: – общая сумма квадратов отклонений зависимой переменной от ее среднего – объясненная регрессией сумма квадратов отклонений –сумма квадратов остатков

Слайд 28





R-квадрат 
Какую долю разброса данных объясняет модель линейной регрессии?
Описание слайда:
R-квадрат Какую долю разброса данных объясняет модель линейной регрессии?

Слайд 29





Интерпретация
Корреляция не значит каузация (причинно-следственная связь) 
X влияет на Y
Y влияет на X
Z влияет на X и Y 
Экстремальные значения могут сильно повлиять на построение модели
Описание слайда:
Интерпретация Корреляция не значит каузация (причинно-следственная связь) X влияет на Y Y влияет на X Z влияет на X и Y Экстремальные значения могут сильно повлиять на построение модели

Слайд 30





Связь между метрической и категориальной переменной
Описание слайда:
Связь между метрической и категориальной переменной

Слайд 31





Дисперсионный анализ 
Дисперсионный анализ позволяет ответить на вопрос, влияет ли интересующая нас номинальная переменная (фактор) на количественную переменную (отклик) 
Сравниваются средние переменной отклика для каждой группы (фактора)
Описание слайда:
Дисперсионный анализ Дисперсионный анализ позволяет ответить на вопрос, влияет ли интересующая нас номинальная переменная (фактор) на количественную переменную (отклик) Сравниваются средние переменной отклика для каждой группы (фактора)

Слайд 32





Сравнение средних
Одинаков ли размер наказания для тех, у кого есть иждивенцы и для тех, у кого нет?
Описание слайда:
Сравнение средних Одинаков ли размер наказания для тех, у кого есть иждивенцы и для тех, у кого нет?

Слайд 33





Сравнение, используя ящичковую диаграмму
graph box sent , over (dependants)
Описание слайда:
Сравнение, используя ящичковую диаграмму graph box sent , over (dependants)

Слайд 34





Виды связей между переменными
Описание слайда:
Виды связей между переменными

Слайд 35





Практическое занятие - 3
Описание слайда:
Практическое занятие - 3

Слайд 36





Пропущенные значения (missing data) 
Dealing with missing data: Key assumptions and methods for applied analysis Marina Soley-Bori msoley@bu.edu
Описание слайда:
Пропущенные значения (missing data) Dealing with missing data: Key assumptions and methods for applied analysis Marina Soley-Bori msoley@bu.edu

Слайд 37





Стандартизация показателей
Z-стандартизация
Позволяет сравнивать значения, измеренные в разных шкалах
Например, при поступлении на PhD 
Петр подал результаты сдачи IELTS = 7,5 (Mean (IELTS) = 6,02, STD = 1,2)
Вероника подала результаты сдачи TOEFL = 97 (mean = 85, STD = 18) 
У кого английский лучше?
Описание слайда:
Стандартизация показателей Z-стандартизация Позволяет сравнивать значения, измеренные в разных шкалах Например, при поступлении на PhD Петр подал результаты сдачи IELTS = 7,5 (Mean (IELTS) = 6,02, STD = 1,2) Вероника подала результаты сдачи TOEFL = 97 (mean = 85, STD = 18) У кого английский лучше?

Слайд 38





Операция стандартизации
Стандартизация – преобразование произвольного распределения с параметрами  в нормальное с параметрами (0,1) 
Стандартизация – смещение распределения и изменение его формы, чтобы оно стало стандартным
Описание слайда:
Операция стандартизации Стандартизация – преобразование произвольного распределения с параметрами в нормальное с параметрами (0,1) Стандартизация – смещение распределения и изменение его формы, чтобы оно стало стандартным

Слайд 39





Правило «трех сигм»
Описание слайда:
Правило «трех сигм»

Слайд 40





Создание таблиц сопряженности 
tabout gravity education using table2.doc, append dpcomma cells (row)
tabout gravity education using table2.doc, append dpcomma cells (row)
Описание слайда:
Создание таблиц сопряженности tabout gravity education using table2.doc, append dpcomma cells (row) tabout gravity education using table2.doc, append dpcomma cells (row)

Слайд 41





Построение гистограмм для двух категорий
catplot sentsusp dependants , percent(dependants) blabel(bar, position(outside) format(%3.1f)) ylabel(none) yscale(r(0,60)) ytitle("") subtitle("назначение вида наказани в зависимости от наличи иждивенцев") asyvars bar(1, bcolor(navy)) bar(2, bcolor(green))
Описание слайда:
Построение гистограмм для двух категорий catplot sentsusp dependants , percent(dependants) blabel(bar, position(outside) format(%3.1f)) ylabel(none) yscale(r(0,60)) ytitle("") subtitle("назначение вида наказани в зависимости от наличи иждивенцев") asyvars bar(1, bcolor(navy)) bar(2, bcolor(green))

Слайд 42





Построение корреляций
Корреляция между двумя переменными
cor sent episodes
Все парные корреляции между набором переменных 
pwcorr sent episodes age
Описание слайда:
Построение корреляций Корреляция между двумя переменными cor sent episodes Все парные корреляции между набором переменных pwcorr sent episodes age

Слайд 43





Регрессионный анализ: этапы 
Построить модель (что является зависимой переменной, что независимой)
Построить диаграмму рассеяния 
Построить описательные статистики для всех переменных, включенных в модель
Описание слайда:
Регрессионный анализ: этапы Построить модель (что является зависимой переменной, что независимой) Построить диаграмму рассеяния Построить описательные статистики для всех переменных, включенных в модель

Слайд 44





Диаграмма рассеяния
Диаграмма рассеяния
twoway (scatter sent priors_count)   
Регрессионная линия 
graph twoway lfit sent priors_count
Диаграмма рассеяния и регрессионная линия на одном графике 
graph twoway (lfit sent priors_count) (scatter sent priors_count) ,
Описание слайда:
Диаграмма рассеяния Диаграмма рассеяния twoway (scatter sent priors_count) Регрессионная линия graph twoway lfit sent priors_count Диаграмма рассеяния и регрессионная линия на одном графике graph twoway (lfit sent priors_count) (scatter sent priors_count) ,

Слайд 45


Связи между двумя переменными (лекция 9), слайд №45
Описание слайда:

Слайд 46


Связи между двумя переменными (лекция 9), слайд №46
Описание слайда:

Слайд 47


Связи между двумя переменными (лекция 9), слайд №47
Описание слайда:

Слайд 48





Вывод во внешний файл
ssc install outreg2 
outreg2 using regres1.doc, replace ctitle (“Модель 1") label  addtext(Other controls , NO)
Описание слайда:
Вывод во внешний файл ssc install outreg2 outreg2 using regres1.doc, replace ctitle (“Модель 1") label addtext(Other controls , NO)

Слайд 49





Описательные статистики для набора переменных 
preserve
keep(sent priors_count)
outreg2 using table3.doc, replace sum(log) keep(sent priors_count)
Описание слайда:
Описательные статистики для набора переменных preserve keep(sent priors_count) outreg2 using table3.doc, replace sum(log) keep(sent priors_count)

Слайд 50





Отдельные описательные статистики (опция eqkeep)
outreg2 using table3.doc, replace sum(log) keep(sent priors_count) eqkeep(N mean sd)
Описание слайда:
Отдельные описательные статистики (опция eqkeep) outreg2 using table3.doc, replace sum(log) keep(sent priors_count) eqkeep(N mean sd)

Слайд 51





Средние для групп
Описание слайда:
Средние для групп



Похожие презентации
Mypresentation.ru
Загрузить презентацию