🗊Презентация Нахождение и использование регрессионных зависимостей

Категория: Информатика
Нажмите для полного просмотра!
Нахождение и использование регрессионных зависимостей, слайд №1Нахождение и использование регрессионных зависимостей, слайд №2Нахождение и использование регрессионных зависимостей, слайд №3Нахождение и использование регрессионных зависимостей, слайд №4Нахождение и использование регрессионных зависимостей, слайд №5Нахождение и использование регрессионных зависимостей, слайд №6Нахождение и использование регрессионных зависимостей, слайд №7Нахождение и использование регрессионных зависимостей, слайд №8Нахождение и использование регрессионных зависимостей, слайд №9Нахождение и использование регрессионных зависимостей, слайд №10Нахождение и использование регрессионных зависимостей, слайд №11Нахождение и использование регрессионных зависимостей, слайд №12Нахождение и использование регрессионных зависимостей, слайд №13Нахождение и использование регрессионных зависимостей, слайд №14Нахождение и использование регрессионных зависимостей, слайд №15Нахождение и использование регрессионных зависимостей, слайд №16Нахождение и использование регрессионных зависимостей, слайд №17Нахождение и использование регрессионных зависимостей, слайд №18Нахождение и использование регрессионных зависимостей, слайд №19Нахождение и использование регрессионных зависимостей, слайд №20Нахождение и использование регрессионных зависимостей, слайд №21

Содержание

Вы можете ознакомиться и скачать презентацию на тему Нахождение и использование регрессионных зависимостей. Доклад-сообщение содержит 21 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Нахождение и использование регрессионных зависимостей
Графеева Н.Г.
2016
Описание слайда:
Нахождение и использование регрессионных зависимостей Графеева Н.Г. 2016

Слайд 2





Регрессия (в статистике) 
Одна из задач Data Mining – нахождение регрессионных зависимостей.
Регрессия (regressio — обратное движение) в статистике — статистическая зависимость среднего значения случайной величины от значений другой случайной величины или нескольких случайных величин; введена Фрэнсисом Гальтоном (1886). 

В отличие от чистой функциональной зависимости  y = f(x) , которая каждому значению независимой переменной x ставит в соответствие одно определённое значение величины y , при регрессионной зависимости одному и тому же значению  x могут соответствовать различные значения величины y. Если при каждом значении x = xi наблюдается n значений  yi1, yi2, …, yin величины y , то зависимость среднего арифметического 
yi' = (yi1 + yi2 +…+ yin)/n

от xi и является средней регрессией. 
Классическим примером средней регрессии служит зависимость среднего роста детей от роста родителей, а также зависимость средних диаметров сосен от их высот и т.п.
Описание слайда:
Регрессия (в статистике) Одна из задач Data Mining – нахождение регрессионных зависимостей. Регрессия (regressio — обратное движение) в статистике — статистическая зависимость среднего значения случайной величины от значений другой случайной величины или нескольких случайных величин; введена Фрэнсисом Гальтоном (1886). В отличие от чистой функциональной зависимости y = f(x) , которая каждому значению независимой переменной x ставит в соответствие одно определённое значение величины y , при регрессионной зависимости одному и тому же значению x могут соответствовать различные значения величины y. Если при каждом значении x = xi наблюдается n значений yi1, yi2, …, yin величины y , то зависимость среднего арифметического yi' = (yi1 + yi2 +…+ yin)/n от xi и является средней регрессией. Классическим примером средней регрессии служит зависимость среднего роста детей от роста родителей, а также зависимость средних диаметров сосен от их высот и т.п.

Слайд 3





Пример:линейная регрессия
Описание слайда:
Пример:линейная регрессия

Слайд 4





Пример:полиномиальная (2 степени) и комбинированная регрессии
Описание слайда:
Пример:полиномиальная (2 степени) и комбинированная регрессии

Слайд 5





Для каких задач могут использоваться регрессионные зависимости?
Восстановление пропущенных значений в данных;
Сглаживание зашумленных данных;
Прогнозирование;
Определение трендов в зашумленных данных;
Оценивание качества торговых стратегий биржевых роботов
и т.п.
Описание слайда:
Для каких задач могут использоваться регрессионные зависимости? Восстановление пропущенных значений в данных; Сглаживание зашумленных данных; Прогнозирование; Определение трендов в зашумленных данных; Оценивание качества торговых стратегий биржевых роботов и т.п.

Слайд 6





Какие бывают регрессии?
Линейные
Полиномиальные
Синусоидальные
Экспоненциальные и т.п.
Сегодня рассмотрим только метод определения линейной регрессии и оценку качества …
Описание слайда:
Какие бывают регрессии? Линейные Полиномиальные Синусоидальные Экспоненциальные и т.п. Сегодня рассмотрим только метод определения линейной регрессии и оценку качества …

Слайд 7





Как определить линейную регрессию?
    Любая линейная функция может быть записана уравнением:

y = a x + b

Задача заключается в отыскании коэффициента a и смещения b таких, чтобы все исследуемые точки лежали наиболее близко к линии регрессии.
С этой целью чаще всего используется метод наименьших квадратов (МНК), суть которого заключается в следующем: сумма квадратов отклонений значения точки от линии регрессии принимает минимальное значение.
Описание слайда:
Как определить линейную регрессию? Любая линейная функция может быть записана уравнением: y = a x + b Задача заключается в отыскании коэффициента a и смещения b таких, чтобы все исследуемые точки лежали наиболее близко к линии регрессии. С этой целью чаще всего используется метод наименьших квадратов (МНК), суть которого заключается в следующем: сумма квадратов отклонений значения точки от линии регрессии принимает минимальное значение.

Слайд 8





Метод наименьших квадратов
Описание слайда:
Метод наименьших квадратов

Слайд 9





Пример: прямая, построенная по методу наименьших квадратов
Описание слайда:
Пример: прямая, построенная по методу наименьших квадратов

Слайд 10





Метод наименьших квадратов
    Определение коэффициентов уравнения  y = ax + b:
Описание слайда:
Метод наименьших квадратов Определение коэффициентов уравнения y = ax + b:

Слайд 11





Применение линейной регрессии для прогнозов и сглаживания
Можно применять линейную регрессию  для прогнозирования (сглаживания) значений в пределах наблюдаемого диапазона возможных значений. 

Мы предсказываем среднюю величину  y для наблюдаемых x, которые имеют определенное значение путем подстановки этого значения в уравнение линейной регрессии. 

Итак, если x = x0 ,прогнозируем (сглаживаем) y как 
y0 = a* x0 + b

Примечания: в задачах линейного сглаживания и прогнозирования вовсе не требуется опираться на весь исторический период наблюдений. Наоборот, следует использовать только  последнюю, наиболее значимую часть наблюдений!
Описание слайда:
Применение линейной регрессии для прогнозов и сглаживания Можно применять линейную регрессию для прогнозирования (сглаживания) значений в пределах наблюдаемого диапазона возможных значений. Мы предсказываем среднюю величину y для наблюдаемых x, которые имеют определенное значение путем подстановки этого значения в уравнение линейной регрессии. Итак, если x = x0 ,прогнозируем (сглаживаем) y как y0 = a* x0 + b Примечания: в задачах линейного сглаживания и прогнозирования вовсе не требуется опираться на весь исторический период наблюдений. Наоборот, следует использовать только последнюю, наиболее значимую часть наблюдений!

Слайд 12





Как оценить качество прогноза?
Можно использовать одну из возможных метрик, например MAPE (Mean Absolute Percentage Error ):
где n-количество предсказаний,
yt  - реальное значение,
Ft – предсказанное значение.
Описание слайда:
Как оценить качество прогноза? Можно использовать одну из возможных метрик, например MAPE (Mean Absolute Percentage Error ): где n-количество предсказаний, yt - реальное значение, Ft – предсказанное значение.

Слайд 13





Как оценить качество линейной регрессии?
В некоторых прикладных задачах мы должны строить линейную регрессию на основе всех точек наблюдения и оценивать ее качество (например, оценка эффективности работы биржевого робота). Для такой оценки существует понятие коэффициента детерминации – R2.  Он может принимать значения от 0 до 1. Основной смысл этого понятия – если анализируемые точки лежат близко к линии регрессии, то линия хорошо соответствует исходным данным.  Если коэффициент детерминации близок к 1, линия соответствует исходным данным, близок к 0 – плохо (то есть исходная кривая неустойчивая и плохо аппроксимируется прямой линией).
Описание слайда:
Как оценить качество линейной регрессии? В некоторых прикладных задачах мы должны строить линейную регрессию на основе всех точек наблюдения и оценивать ее качество (например, оценка эффективности работы биржевого робота). Для такой оценки существует понятие коэффициента детерминации – R2. Он может принимать значения от 0 до 1. Основной смысл этого понятия – если анализируемые точки лежат близко к линии регрессии, то линия хорошо соответствует исходным данным. Если коэффициент детерминации близок к 1, линия соответствует исходным данным, близок к 0 – плохо (то есть исходная кривая неустойчивая и плохо аппроксимируется прямой линией).

Слайд 14





Как рассчитывается коэффициент детерминации?
Описание слайда:
Как рассчитывается коэффициент детерминации?

Слайд 15





Пример: хорошая аппроксимация графика доходности (R2 = 0.969)
Описание слайда:
Пример: хорошая аппроксимация графика доходности (R2 = 0.969)

Слайд 16





Пример: плохая аппроксимация графика доходности (R2 = 0.012)
Описание слайда:
Пример: плохая аппроксимация графика доходности (R2 = 0.012)

Слайд 17





Есть ли какие-нибудь подходящие функции в современных СУБД?
Все наиболее известные СУБД на сегодняшний день тянутся к внедрению разнообразных методов data mining (особенно в последних релизах). Разумеется, ORACLE тоже. В частности в качестве метода линейной регрессии в нем реализован метод наименьших квадратов, позволяющий вычислять коэффициент a и смещение b для соответствующего линейного уравнения y = ax + b.
Описание слайда:
Есть ли какие-нибудь подходящие функции в современных СУБД? Все наиболее известные СУБД на сегодняшний день тянутся к внедрению разнообразных методов data mining (особенно в последних релизах). Разумеется, ORACLE тоже. В частности в качестве метода линейной регрессии в нем реализован метод наименьших квадратов, позволяющий вычислять коэффициент a и смещение b для соответствующего линейного уравнения y = ax + b.

Слайд 18





Как выглядят соответствующие функции в ORACLE SQL?
REGR_COUNT(y, x) –количество пар в sql-запросе с определенными значениями для y и x  (т.е. не null)
REGR_SLOPE(y, x)   - коэффициент a для линейного уравнения y=ax+b
REGR_INTERCEPT (y, x) - смещение b для линейного уравнения y=ax+b
REGR_R2(y,x) – коэффициент детерминации

Примечание: в sql функциях regr_slope и regr_intercept  реализован метод наименьших квадратов.
Описание слайда:
Как выглядят соответствующие функции в ORACLE SQL? REGR_COUNT(y, x) –количество пар в sql-запросе с определенными значениями для y и x (т.е. не null) REGR_SLOPE(y, x) - коэффициент a для линейного уравнения y=ax+b REGR_INTERCEPT (y, x) - смещение b для линейного уравнения y=ax+b REGR_R2(y,x) – коэффициент детерминации Примечание: в sql функциях regr_slope и regr_intercept реализован метод наименьших квадратов.

Слайд 19





Использование функций регрессии в ORACLE SQL
select regr_slope(2 * id + 5, id) "КОЭФФИЦИЕНТ A",  
           regr_intercept(2 * id + 5, id) "СМЕЩЕНИЕ B"
from goodsamount
Описание слайда:
Использование функций регрессии в ORACLE SQL select regr_slope(2 * id + 5, id) "КОЭФФИЦИЕНТ A", regr_intercept(2 * id + 5, id) "СМЕЩЕНИЕ B" from goodsamount

Слайд 20





Пример. Исходные данные для прогнозирования
Описание слайда:
Пример. Исходные данные для прогнозирования

Слайд 21





Пример. Прогнозирование очередного значения
Описание слайда:
Пример. Прогнозирование очередного значения



Похожие презентации
Mypresentation.ru
Загрузить презентацию