🗊Презентация Машина опорных векторов. Лабораторная работа № 5

Нажмите для полного просмотра!
Машина опорных векторов. Лабораторная работа № 5, слайд №1Машина опорных векторов. Лабораторная работа № 5, слайд №2Машина опорных векторов. Лабораторная работа № 5, слайд №3Машина опорных векторов. Лабораторная работа № 5, слайд №4Машина опорных векторов. Лабораторная работа № 5, слайд №5Машина опорных векторов. Лабораторная работа № 5, слайд №6Машина опорных векторов. Лабораторная работа № 5, слайд №7Машина опорных векторов. Лабораторная работа № 5, слайд №8Машина опорных векторов. Лабораторная работа № 5, слайд №9Машина опорных векторов. Лабораторная работа № 5, слайд №10Машина опорных векторов. Лабораторная работа № 5, слайд №11Машина опорных векторов. Лабораторная работа № 5, слайд №12Машина опорных векторов. Лабораторная работа № 5, слайд №13Машина опорных векторов. Лабораторная работа № 5, слайд №14Машина опорных векторов. Лабораторная работа № 5, слайд №15Машина опорных векторов. Лабораторная работа № 5, слайд №16Машина опорных векторов. Лабораторная работа № 5, слайд №17Машина опорных векторов. Лабораторная работа № 5, слайд №18Машина опорных векторов. Лабораторная работа № 5, слайд №19Машина опорных векторов. Лабораторная работа № 5, слайд №20Машина опорных векторов. Лабораторная работа № 5, слайд №21Машина опорных векторов. Лабораторная работа № 5, слайд №22Машина опорных векторов. Лабораторная работа № 5, слайд №23Машина опорных векторов. Лабораторная работа № 5, слайд №24Машина опорных векторов. Лабораторная работа № 5, слайд №25Машина опорных векторов. Лабораторная работа № 5, слайд №26Машина опорных векторов. Лабораторная работа № 5, слайд №27Машина опорных векторов. Лабораторная работа № 5, слайд №28Машина опорных векторов. Лабораторная работа № 5, слайд №29Машина опорных векторов. Лабораторная работа № 5, слайд №30Машина опорных векторов. Лабораторная работа № 5, слайд №31Машина опорных векторов. Лабораторная работа № 5, слайд №32Машина опорных векторов. Лабораторная работа № 5, слайд №33Машина опорных векторов. Лабораторная работа № 5, слайд №34Машина опорных векторов. Лабораторная работа № 5, слайд №35

Содержание

Вы можете ознакомиться и скачать презентацию на тему Машина опорных векторов. Лабораторная работа № 5. Доклад-сообщение содержит 35 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Лабораторная работа № 5 
Машина опорных векторов
Описание слайда:
Лабораторная работа № 5 Машина опорных векторов

Слайд 2





Бизнес-задача
Задача – отличить фальшивые банкноты от настоящих
База Banknote authentification: https://archive.ics.uci.edu/ml/datasets/banknote+authentication 
Объекты представляют из себя характеристики изображений банкнот
1372 объекта
4 признака: 
энтропия изображения
коэффициенты дисперсии, ассиметрии и эксцесса вейвлет-преобразования изображения
Класс (фальшивые или настоящие)
Описание слайда:
Бизнес-задача Задача – отличить фальшивые банкноты от настоящих База Banknote authentification: https://archive.ics.uci.edu/ml/datasets/banknote+authentication Объекты представляют из себя характеристики изображений банкнот 1372 объекта 4 признака: энтропия изображения коэффициенты дисперсии, ассиметрии и эксцесса вейвлет-преобразования изображения Класс (фальшивые или настоящие)

Слайд 3





Бизнес-задача
Способ решения – классификация
Метод классификации – SVM (Support Vector Machine)
Положительные стороны SVM:
быстрый метод классификации;
метод сводится к решению задачи квадратичного программирования в выпуклой области, которая обычно имеет единственное решение;
метод позволяет осуществлять более уверенную классификацию, чем другие линейные методы.
Описание слайда:
Бизнес-задача Способ решения – классификация Метод классификации – SVM (Support Vector Machine) Положительные стороны SVM: быстрый метод классификации; метод сводится к решению задачи квадратичного программирования в выпуклой области, которая обычно имеет единственное решение; метод позволяет осуществлять более уверенную классификацию, чем другие линейные методы.

Слайд 4





Метод Support Vector Machine
Изобретён в 1963 году, авторы – Вапник, Червоненкис
Современная постановка в 1995 году
Классификатор – разделяющая гиперплоскость
Гиперплоскость является наилучшей в смысле ширины «разделяющей полосы»
Точки на границах «полосы» называются «опорными» - отсюда название
В чём смысл увеличивать ширину полосы?
Описание слайда:
Метод Support Vector Machine Изобретён в 1963 году, авторы – Вапник, Червоненкис Современная постановка в 1995 году Классификатор – разделяющая гиперплоскость Гиперплоскость является наилучшей в смысле ширины «разделяющей полосы» Точки на границах «полосы» называются «опорными» - отсюда название В чём смысл увеличивать ширину полосы?

Слайд 5


Машина опорных векторов. Лабораторная работа № 5, слайд №5
Описание слайда:

Слайд 6





Математическая постановка
Пусть даны два линейно разделимых класса объектов
Мы можем описать все точки разделяющей гиперплоскости используя вектор-нормаль к этой гиперплоскости:
Данная разделяющая гиперплоскость находится в «разделяющей полосе», которую мы также можем задать уравнениями:
Описание слайда:
Математическая постановка Пусть даны два линейно разделимых класса объектов Мы можем описать все точки разделяющей гиперплоскости используя вектор-нормаль к этой гиперплоскости: Данная разделяющая гиперплоскость находится в «разделяющей полосе», которую мы также можем задать уравнениями:

Слайд 7


Машина опорных векторов. Лабораторная работа № 5, слайд №7
Описание слайда:

Слайд 8





Математическая постановка
Можно найти ширину данной полосы как
Для машины опорных векторов необходимо найти разделяющую гиперплоскость, которая задает полосу максимальной ширины. Задача оптимизации:
Описание слайда:
Математическая постановка Можно найти ширину данной полосы как Для машины опорных векторов необходимо найти разделяющую гиперплоскость, которая задает полосу максимальной ширины. Задача оптимизации:

Слайд 9





Решение оптимизационной задачи
Метод множителей Лагранжа:
Производные:
Двойственная проблема:
Описание слайда:
Решение оптимизационной задачи Метод множителей Лагранжа: Производные: Двойственная проблема:

Слайд 10





Случай линейно неразделимой выборки
Описание слайда:
Случай линейно неразделимой выборки

Слайд 11





Случай линейно неразделимой выборки
Метод множителей Лагранжа:
Производные:
Двойственная проблема:
Описание слайда:
Случай линейно неразделимой выборки Метод множителей Лагранжа: Производные: Двойственная проблема:

Слайд 12





Предсказание
Для предсказания результата алгоритма, используется функция sign:
Для λi=0 точка xi не является «опорной», таким образом, в сумму, которая определяет класс нового объекта, влияние вносят только «опорные» точки.
Описание слайда:
Предсказание Для предсказания результата алгоритма, используется функция sign: Для λi=0 точка xi не является «опорной», таким образом, в сумму, которая определяет класс нового объекта, влияние вносят только «опорные» точки.

Слайд 13





Использование метода SVM
Использован набор данных Banknote Authentification
В качестве тестовой выборки взяты 107 последних объектов класса «0» (настоящие банкноты) и 119 объектов класса «1» (фальшивки). Остальные объекты используются в качестве обучающей выборки.
Исходные параметры алгоритмов SVM взяты одинаковыми для разных библиотек.
Описание слайда:
Использование метода SVM Использован набор данных Banknote Authentification В качестве тестовой выборки взяты 107 последних объектов класса «0» (настоящие банкноты) и 119 объектов класса «1» (фальшивки). Остальные объекты используются в качестве обучающей выборки. Исходные параметры алгоритмов SVM взяты одинаковыми для разных библиотек.

Слайд 14





Обучение модели, Intel DAAL
Описание слайда:
Обучение модели, Intel DAAL

Слайд 15





Предсказание, Intel DAAL
Описание слайда:
Предсказание, Intel DAAL

Слайд 16





Предсказание, Intel DAAL
Описание слайда:
Предсказание, Intel DAAL

Слайд 17





Алгоритм SVM, Python, R
Описание слайда:
Алгоритм SVM, Python, R

Слайд 18





Результаты вычислений для данных Banknote Authentification
Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с одинаковыми параметрами:
DAAL: ~0.021 секунды, 2 ошибки
Python: ~0.007 секунды, 2 ошибки
R: ~0.14 секунды, 7 ошибок
Описание слайда:
Результаты вычислений для данных Banknote Authentification Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с одинаковыми параметрами: DAAL: ~0.021 секунды, 2 ошибки Python: ~0.007 секунды, 2 ошибки R: ~0.14 секунды, 7 ошибок

Слайд 19





Ядра (Kernel Trick)
Ядро – функция специального вида:
Симметричная
Неотрицательно определенная
Ядро используется вместо линейного скалярного произведения точек:
Описание слайда:
Ядра (Kernel Trick) Ядро – функция специального вида: Симметричная Неотрицательно определенная Ядро используется вместо линейного скалярного произведения точек:

Слайд 20





Kernel Trick
Функция ядра переводит точки в пространство большей размерности. Пример:
Описание слайда:
Kernel Trick Функция ядра переводит точки в пространство большей размерности. Пример:

Слайд 21





Пример использования ядра
 
Описание слайда:
Пример использования ядра  

Слайд 22





Виды ядер
 
Описание слайда:
Виды ядер  

Слайд 23





Предсказание
Для предсказания результата алгоритма, используется функция sign:
Для λi=0 точка xi не является «опорной», таким образом, в сумму, которая определяет класс нового объекта, влияние вносят только «опорные» точки.
Описание слайда:
Предсказание Для предсказания результата алгоритма, используется функция sign: Для λi=0 точка xi не является «опорной», таким образом, в сумму, которая определяет класс нового объекта, влияние вносят только «опорные» точки.

Слайд 24





Результаты вычислений для данных Banknote Authentification
Результаты вычислений (суммарное время получения модели + предсказание, количество ошибок):
DAAL: ~2.5 секунды, 2 ошибки
Python: ~0.014 секунды, 0 ошибок
R: ~0.065 секунды, 1 ошибка
Почему результаты получились разные?
Описание слайда:
Результаты вычислений для данных Banknote Authentification Результаты вычислений (суммарное время получения модели + предсказание, количество ошибок): DAAL: ~2.5 секунды, 2 ошибки Python: ~0.014 секунды, 0 ошибок R: ~0.065 секунды, 1 ошибка Почему результаты получились разные?

Слайд 25





Результаты вычислений для данных Banknote Authentification
Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с ядром radial и стандартными параметрами(200 MB кэш, большое количество итераций):
DAAL: ~0.024 секунды, 0 ошибок
Python: ~0.007 секунды, 0 ошибок
R: ~0.065 секунды, 1 ошибка
Описание слайда:
Результаты вычислений для данных Banknote Authentification Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с ядром radial и стандартными параметрами(200 MB кэш, большое количество итераций): DAAL: ~0.024 секунды, 0 ошибок Python: ~0.007 секунды, 0 ошибок R: ~0.065 секунды, 1 ошибка

Слайд 26





Результаты вычислений для данных Banknote Authentification
Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с ядром radial и одинаковыми заданными параметрами (gamma = 1,iterations = no_limit):
DAAL: ~0.035 секунды, 0 ошибок
Python: ~0.061 секунды, 0 ошибок
R: ~0.052 секунды, 0 ошибок
Описание слайда:
Результаты вычислений для данных Banknote Authentification Результаты вычислений(суммарное время получения модели + предсказание, количество ошибок) с ядром radial и одинаковыми заданными параметрами (gamma = 1,iterations = no_limit): DAAL: ~0.035 секунды, 0 ошибок Python: ~0.061 секунды, 0 ошибок R: ~0.052 секунды, 0 ошибок

Слайд 27





Набор данных Adult Income*
Описание слайда:
Набор данных Adult Income*

Слайд 28





Признаки
Описание слайда:
Признаки

Слайд 29





Набор данных Adult Income*
Описание слайда:
Набор данных Adult Income*

Слайд 30





Результаты вычислений для данных Adult Income
Результаты вычислений:
DAAL: ~400 секунд, точность 0.63 (линейное ядро, после бинаризации, 200000 итераций, точность 0.001)
Python: ~20 секунд, точность 0.75(линейное ядро, после бинаризации, 100000 итераций, точность 0.001, сходимость не достигнута)
Python: ~40 секунд, точность 0.56(линейное ядро, после бинаризации, 200000 итераций, точность 0.001, сходимость не достигнута)
Python: ~2400 секунд, точность 0.79(линейное ядро, после бинаризации, без ограничения на количество итераций, точность 0.001, сходимость достигнута)
Python ~150 секунд, точность 0.75(ядро rbf, после бинаризации, 100000 итераций, точность 0.001, сходимость достигнута)
R: ~64 секунды, точность 0.848 (ядро rbf, без бинаризации)
R: ~430 секунд, точность 0.839 (ядро rbf, после бинаризации)
R: ~80 секунд, точность 0.846 (ядро linear, без бинаризации)
Описание слайда:
Результаты вычислений для данных Adult Income Результаты вычислений: DAAL: ~400 секунд, точность 0.63 (линейное ядро, после бинаризации, 200000 итераций, точность 0.001) Python: ~20 секунд, точность 0.75(линейное ядро, после бинаризации, 100000 итераций, точность 0.001, сходимость не достигнута) Python: ~40 секунд, точность 0.56(линейное ядро, после бинаризации, 200000 итераций, точность 0.001, сходимость не достигнута) Python: ~2400 секунд, точность 0.79(линейное ядро, после бинаризации, без ограничения на количество итераций, точность 0.001, сходимость достигнута) Python ~150 секунд, точность 0.75(ядро rbf, после бинаризации, 100000 итераций, точность 0.001, сходимость достигнута) R: ~64 секунды, точность 0.848 (ядро rbf, без бинаризации) R: ~430 секунд, точность 0.839 (ядро rbf, после бинаризации) R: ~80 секунд, точность 0.846 (ядро linear, без бинаризации)

Слайд 31





Результаты вычислений для данных Adult Income
Описание слайда:
Результаты вычислений для данных Adult Income

Слайд 32





Плюсы и минусы SVM
Плюсы:
это наиболее быстрый метод нахождения решающих функций;
метод сводится к решению задачи квадратичного программирования в выпуклой области, которая всегда имеет единственное решение;
метод находит разделяющую полосу максимальной ширины (для заданных параметров), что позволяет в дальнейшем осуществлять более уверенную классификацию (и интерпретацию);
Минусы
метод чувствителен к шумам и стандартизации данных;
не существует общего подхода к автоматическому выбору ядра, его параметров и построению спрямляющего подпространства в целом в случае линейной неразделимости классов.
Описание слайда:
Плюсы и минусы SVM Плюсы: это наиболее быстрый метод нахождения решающих функций; метод сводится к решению задачи квадратичного программирования в выпуклой области, которая всегда имеет единственное решение; метод находит разделяющую полосу максимальной ширины (для заданных параметров), что позволяет в дальнейшем осуществлять более уверенную классификацию (и интерпретацию); Минусы метод чувствителен к шумам и стандартизации данных; не существует общего подхода к автоматическому выбору ядра, его параметров и построению спрямляющего подпространства в целом в случае линейной неразделимости классов.

Слайд 33





Практическое задание
Проанализировать разные результаты для набора данных Banknote Authentification, в чём разница базовых настроек алгоритма в разных инструментах?
Найти наилучшие параметры для данных Banknote Authentification, используя технику кросс-валидации.
Возможно ли улучшить точность алгоритма для данных Adult Income, используя другие параметры (gamma, C, параметры связанные с SVM)? Подобрать параметры, дающие большую точность или показать, что для большого набора параметров точность улучшить не удаётся.
Описание слайда:
Практическое задание Проанализировать разные результаты для набора данных Banknote Authentification, в чём разница базовых настроек алгоритма в разных инструментах? Найти наилучшие параметры для данных Banknote Authentification, используя технику кросс-валидации. Возможно ли улучшить точность алгоритма для данных Adult Income, используя другие параметры (gamma, C, параметры связанные с SVM)? Подобрать параметры, дающие большую точность или показать, что для большого набора параметров точность улучшить не удаётся.

Слайд 34





Ссылки на реализации алгоритма
http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf - LIBSVM: A Library for Support Vector Machines, Chih-Chung Chang and Chih-Jen Lin; статья с описанием реализации SVM – модели, алгоритмы(R,Python).
http://www.csie.ntu.edu.tw/~cjlin/papers/quadworkset.pdf - Working Set Selection Using Second Order Information for Training Support Vector Machines, Rong-En Fan, Pai-Hsuen Chen, Chih-Jen Lin; статья с более детальным описанием реализации SVM(R,DAAL).
Описание слайда:
Ссылки на реализации алгоритма http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf - LIBSVM: A Library for Support Vector Machines, Chih-Chung Chang and Chih-Jen Lin; статья с описанием реализации SVM – модели, алгоритмы(R,Python). http://www.csie.ntu.edu.tw/~cjlin/papers/quadworkset.pdf - Working Set Selection Using Second Order Information for Training Support Vector Machines, Rong-En Fan, Pai-Hsuen Chen, Chih-Jen Lin; статья с более детальным описанием реализации SVM(R,DAAL).

Слайд 35





Литература
Charu C. Aggarwal. Data Mining. The Textbook. Springer International Publishing Switzerland, 2015.
http://www.ccas.ru/voron/download/SVM.pdf   - К.В. Воронцов. Лекции по методу опорных векторов, 2007
Описание слайда:
Литература Charu C. Aggarwal. Data Mining. The Textbook. Springer International Publishing Switzerland, 2015. http://www.ccas.ru/voron/download/SVM.pdf - К.В. Воронцов. Лекции по методу опорных векторов, 2007



Похожие презентации
Mypresentation.ru
Загрузить презентацию