🗊Презентация Понятия о MDS. Аналитические службы MS SQL Server

Категория: Информатика
Нажмите для полного просмотра!
Понятия о MDS. Аналитические службы MS SQL Server, слайд №1Понятия о MDS. Аналитические службы MS SQL Server, слайд №2Понятия о MDS. Аналитические службы MS SQL Server, слайд №3Понятия о MDS. Аналитические службы MS SQL Server, слайд №4Понятия о MDS. Аналитические службы MS SQL Server, слайд №5Понятия о MDS. Аналитические службы MS SQL Server, слайд №6Понятия о MDS. Аналитические службы MS SQL Server, слайд №7Понятия о MDS. Аналитические службы MS SQL Server, слайд №8Понятия о MDS. Аналитические службы MS SQL Server, слайд №9Понятия о MDS. Аналитические службы MS SQL Server, слайд №10Понятия о MDS. Аналитические службы MS SQL Server, слайд №11Понятия о MDS. Аналитические службы MS SQL Server, слайд №12Понятия о MDS. Аналитические службы MS SQL Server, слайд №13Понятия о MDS. Аналитические службы MS SQL Server, слайд №14Понятия о MDS. Аналитические службы MS SQL Server, слайд №15Понятия о MDS. Аналитические службы MS SQL Server, слайд №16Понятия о MDS. Аналитические службы MS SQL Server, слайд №17Понятия о MDS. Аналитические службы MS SQL Server, слайд №18Понятия о MDS. Аналитические службы MS SQL Server, слайд №19Понятия о MDS. Аналитические службы MS SQL Server, слайд №20Понятия о MDS. Аналитические службы MS SQL Server, слайд №21Понятия о MDS. Аналитические службы MS SQL Server, слайд №22Понятия о MDS. Аналитические службы MS SQL Server, слайд №23Понятия о MDS. Аналитические службы MS SQL Server, слайд №24Понятия о MDS. Аналитические службы MS SQL Server, слайд №25Понятия о MDS. Аналитические службы MS SQL Server, слайд №26Понятия о MDS. Аналитические службы MS SQL Server, слайд №27Понятия о MDS. Аналитические службы MS SQL Server, слайд №28Понятия о MDS. Аналитические службы MS SQL Server, слайд №29Понятия о MDS. Аналитические службы MS SQL Server, слайд №30Понятия о MDS. Аналитические службы MS SQL Server, слайд №31Понятия о MDS. Аналитические службы MS SQL Server, слайд №32Понятия о MDS. Аналитические службы MS SQL Server, слайд №33Понятия о MDS. Аналитические службы MS SQL Server, слайд №34Понятия о MDS. Аналитические службы MS SQL Server, слайд №35Понятия о MDS. Аналитические службы MS SQL Server, слайд №36Понятия о MDS. Аналитические службы MS SQL Server, слайд №37Понятия о MDS. Аналитические службы MS SQL Server, слайд №38Понятия о MDS. Аналитические службы MS SQL Server, слайд №39Понятия о MDS. Аналитические службы MS SQL Server, слайд №40Понятия о MDS. Аналитические службы MS SQL Server, слайд №41Понятия о MDS. Аналитические службы MS SQL Server, слайд №42

Содержание

Вы можете ознакомиться и скачать презентацию на тему Понятия о MDS. Аналитические службы MS SQL Server. Доклад-сообщение содержит 42 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Аналитические службы MS SQL Server
Описание слайда:
Аналитические службы MS SQL Server

Слайд 2





Содержание
1. Цель использования аналитических служб
2. Модели добычи данных (DataMining)
3. Алгоритмы добычи данных
3.1. Метод деревья решений
3.2. Кластеризация
4. Построение модели добычи данных
4.1. Построение модели Дерево решений (на примере технологии MS SQL Server 2000)
4.2. Построение модели Naive Bayes (на примере технологии MS SQL Server 2005)
4.3. Анализ модели Microsoft Naive Bayes
Описание слайда:
Содержание 1. Цель использования аналитических служб 2. Модели добычи данных (DataMining) 3. Алгоритмы добычи данных 3.1. Метод деревья решений 3.2. Кластеризация 4. Построение модели добычи данных 4.1. Построение модели Дерево решений (на примере технологии MS SQL Server 2000) 4.2. Построение модели Naive Bayes (на примере технологии MS SQL Server 2005) 4.3. Анализ модели Microsoft Naive Bayes

Слайд 3





1. Цель использования аналитических служб

Информация, которую вы ищете, уже находится в вашей базе данных. Но она спрятана достаточно глубоко, поэтому найти ее, просто просмотрев данные, будет довольно сложно. 
Добыча данных (data mining) извлекает намного больше информации, содержащейся в ваших данных, позволяя вам обнаруживать скрытые взаимосвязи в данных, находить тенденции, наблюдать за причинами конкретных событий либо даже предсказывать производительность или направление для отдельных аспектов данных.
Описание слайда:
1. Цель использования аналитических служб Информация, которую вы ищете, уже находится в вашей базе данных. Но она спрятана достаточно глубоко, поэтому найти ее, просто просмотрев данные, будет довольно сложно. Добыча данных (data mining) извлекает намного больше информации, содержащейся в ваших данных, позволяя вам обнаруживать скрытые взаимосвязи в данных, находить тенденции, наблюдать за причинами конкретных событий либо даже предсказывать производительность или направление для отдельных аспектов данных.

Слайд 4





Аналитические модели в SQL Server 2005
Описание слайда:
Аналитические модели в SQL Server 2005

Слайд 5





2. Модели добычи данных (DataMining) 
Модель добычи данных представляет собой виртуальную структуру, хранящую данные, используемые при выполнении добычи данных на SQL Server. Информация в модели хранится в том же виде, что и в базе данных, но вместо реальных данных в ней находятся правила и шаблоны для данных, хранимых в модели. Эти правила и шаблоны являются интерпретациями многомерных данных в виде статистической информации, которая в дальнейшем используется для предсказания будущего поведения и изменения определенных аспектов данных.
Описание слайда:
2. Модели добычи данных (DataMining) Модель добычи данных представляет собой виртуальную структуру, хранящую данные, используемые при выполнении добычи данных на SQL Server. Информация в модели хранится в том же виде, что и в базе данных, но вместо реальных данных в ней находятся правила и шаблоны для данных, хранимых в модели. Эти правила и шаблоны являются интерпретациями многомерных данных в виде статистической информации, которая в дальнейшем используется для предсказания будущего поведения и изменения определенных аспектов данных.

Слайд 6





3. Алгоритмы добычи данных 
 Microsoft Association Rules. Правила ассоциаций ищут элементы, которые наиболее вероятно появляются вместе в транзакциях и могут быть использованы для прогнозирования присутствия элемента на основании существова­ния других транзакций.
   Microsoft Clustering. Кластеризация ищет естественные группировки дан­ных. Это особенно полезно, если вы хотите видеть условия, которые имеют тенденцию появляться вместе.
   Microsoft Decision Tree. Дерево решений позволяет создавать прогнозы и виртуальные измерения на основе результатов анализа.
   Microsoft Linear Regression. Использование статистики линейной регрессии, позволяющей на основании существующих данных прогнозировать будущие.
   Microsoft Logistic Regression. Использование статистики логистической регрессии, позволяющей на основании существующих данных прогнозировав будущие.
   Microsoft Naive Bayes. Naive Bayes представляет собой алгоритм классификации, который хорошо себя зарекомендовал в моделях прогнозирования если только атрибуты дискретны или дискретизированы. Предполагается что все входные атрибуты не зависят от прогнозируемого.
   Microsoft Neural Network. Нейронные сети лучше всего использовать дл: классификации дискретных атрибутов, а также регрессии непрерывных атрибутов, если вы заинтересованы в прогнозировании множества атрибутов.
   Microsoft Sequence Clustering. Кластеризация последовательностей позволяет прогнозировать наиболее вероятный порядок событий в последовательности, основанной на известных характеристиках.
   Microsoft Time Series. Временные ряды позволяют прогнозировать будущие события, зависящие от времени на основе известных или обнаруженных шаблонов.
Описание слайда:
3. Алгоритмы добычи данных Microsoft Association Rules. Правила ассоциаций ищут элементы, которые наиболее вероятно появляются вместе в транзакциях и могут быть использованы для прогнозирования присутствия элемента на основании существова­ния других транзакций. Microsoft Clustering. Кластеризация ищет естественные группировки дан­ных. Это особенно полезно, если вы хотите видеть условия, которые имеют тенденцию появляться вместе. Microsoft Decision Tree. Дерево решений позволяет создавать прогнозы и виртуальные измерения на основе результатов анализа. Microsoft Linear Regression. Использование статистики линейной регрессии, позволяющей на основании существующих данных прогнозировать будущие. Microsoft Logistic Regression. Использование статистики логистической регрессии, позволяющей на основании существующих данных прогнозировав будущие. Microsoft Naive Bayes. Naive Bayes представляет собой алгоритм классификации, который хорошо себя зарекомендовал в моделях прогнозирования если только атрибуты дискретны или дискретизированы. Предполагается что все входные атрибуты не зависят от прогнозируемого. Microsoft Neural Network. Нейронные сети лучше всего использовать дл: классификации дискретных атрибутов, а также регрессии непрерывных атрибутов, если вы заинтересованы в прогнозировании множества атрибутов. Microsoft Sequence Clustering. Кластеризация последовательностей позволяет прогнозировать наиболее вероятный порядок событий в последовательности, основанной на известных характеристиках. Microsoft Time Series. Временные ряды позволяют прогнозировать будущие события, зависящие от времени на основе известных или обнаруженных шаблонов.

Слайд 7





3.1. Метод деревья решений 
Деревья решений применяются уже довольно долгое время для поиска набора определенных характеристик и правил, а также определения влияния этих правил на искомую переменную. Например, когда вам понадобится определить характерные признаки клиента, который с наибольшей вероятности ответит на рассылку образцов товара, вам придется перевести эти характеристики в набор правил.
Описание слайда:
3.1. Метод деревья решений Деревья решений применяются уже довольно долгое время для поиска набора определенных характеристик и правил, а также определения влияния этих правил на искомую переменную. Например, когда вам понадобится определить характерные признаки клиента, который с наибольшей вероятности ответит на рассылку образцов товара, вам придется перевести эти характеристики в набор правил.

Слайд 8





Задача о грибах. Data Mining, будет состоять из двух процессов:
обучение модели (которое выполняется однократно и требует относительно много времени) 
и принятие решения о том, относится ли конкретный гриб к категории съедобных (что происходит неоднократно).
Описание слайда:
Задача о грибах. Data Mining, будет состоять из двух процессов: обучение модели (которое выполняется однократно и требует относительно много времени) и принятие решения о том, относится ли конкретный гриб к категории съедобных (что происходит неоднократно).

Слайд 9





Исходные данные 
В качестве исходных данных для обучения модели мы воспользуемся набором данных в 8416  грибов, доступных в виде файла в формате CSV по адресу http://www.ics.uci.edu/~mlearn/MLRepository.html, который содержит таблицу, где имеется колонка Edibility с двумя возможными значениями (edible - съедобный и poisonous - ядовитый). Файл содержит таблицу, состоящую из 24 столбцов: 22 признака, таких, как форма и цвет шляпки, ножки и т. д., столбец Edibility (съедобность) с двумя возможными значениями (Edible — съедобный и poisonous — ядовитый) и ключевое поле Number, содержащее уникальные ключи наблюдений от 1 до 8416).
Описание слайда:
Исходные данные В качестве исходных данных для обучения модели мы воспользуемся набором данных в 8416 грибов, доступных в виде файла в формате CSV по адресу http://www.ics.uci.edu/~mlearn/MLRepository.html, который содержит таблицу, где имеется колонка Edibility с двумя возможными значениями (edible - съедобный и poisonous - ядовитый). Файл содержит таблицу, состоящую из 24 столбцов: 22 признака, таких, как форма и цвет шляпки, ножки и т. д., столбец Edibility (съедобность) с двумя возможными значениями (Edible — съедобный и poisonous — ядовитый) и ключевое поле Number, содержащее уникальные ключи наблюдений от 1 до 8416).

Слайд 10





Исходные данные к определению признаков съедобности грибов
Описание слайда:
Исходные данные к определению признаков съедобности грибов

Слайд 11





Выбор полей для исследования
Описание слайда:
Выбор полей для исследования

Слайд 12





Пример отчета дерева решений
Описание слайда:
Пример отчета дерева решений

Слайд 13





Правила классификации данных выглядят так: 
если запах гриба миндальный или анисовый (Odor = ALMOND или Odor = ANIS), то гриб съедобный (EDIBLE); 
если запах другой, то гриб ядовитый (POISONOUS); 
если запаха нет (Odor = NONE), то вопрос требует дальнейшего изучения.
Описание слайда:
Правила классификации данных выглядят так: если запах гриба миндальный или анисовый (Odor = ALMOND или Odor = ANIS), то гриб съедобный (EDIBLE); если запах другой, то гриб ядовитый (POISONOUS); если запаха нет (Odor = NONE), то вопрос требует дальнейшего изучения.

Слайд 14





Второй уровень иерархии 
Второй уровень иерархии доступен только для ветви, содержащей данные о грибах без запаха, поэтому очередным параметром в этом случае оказывается цвет спор (если споры зеленые (Spore Print Color = GREEN), то гриб ядовитый), если другой (Spore print color not = GREEN), то, опять же, необходим анализ еще какого-то параметра.
Описание слайда:
Второй уровень иерархии Второй уровень иерархии доступен только для ветви, содержащей данные о грибах без запаха, поэтому очередным параметром в этом случае оказывается цвет спор (если споры зеленые (Spore Print Color = GREEN), то гриб ядовитый), если другой (Spore print color not = GREEN), то, опять же, необходим анализ еще какого-то параметра.

Слайд 15





Третий уровень иерархии 
Третий уровень иерархии - поверхность ножки под кольцом (Stalk Surface Below Ring), далее для грибов с чешуйчатыми ножками (Stalk Surface Below Ring = SCALY) - анализируем тип колец (Ring Туре), а для остальных - размер пластинки (Gill Size) и цвет шляпки (Cap color).
Описание слайда:
Третий уровень иерархии Третий уровень иерархии - поверхность ножки под кольцом (Stalk Surface Below Ring), далее для грибов с чешуйчатыми ножками (Stalk Surface Below Ring = SCALY) - анализируем тип колец (Ring Туре), а для остальных - размер пластинки (Gill Size) и цвет шляпки (Cap color).

Слайд 16





Область применения
Таким образом, алгоритм построения деревьев решений позволяет определить набор значений характеристик, позволяющих отделить одну категорию данных от другой (в данной ситуации - съедобные грибы от несъедобных); этот процесс называют сегментацией.
Описание слайда:
Область применения Таким образом, алгоритм построения деревьев решений позволяет определить набор значений характеристик, позволяющих отделить одну категорию данных от другой (в данной ситуации - съедобные грибы от несъедобных); этот процесс называют сегментацией.

Слайд 17





3.2. Кластеризация 
При помощи кластеризации информация группируется по схожим признакам. В результате применения данной методики мы получаем сегменты данных, каждый из которых состоит из элементов, схожих по определенным признакам.
Описание слайда:
3.2. Кластеризация При помощи кластеризации информация группируется по схожим признакам. В результате применения данной методики мы получаем сегменты данных, каждый из которых состоит из элементов, схожих по определенным признакам.

Слайд 18





Рассмотрим многофакторную модель анализа индекса РТС
Задачи, решаемые в процессе кластеризации выглядят следующим образом:
1. построить кластерную модель индекса РТС;
1.1. произвести подсоединение к многомерному хранилищу (кубу) как к источнику исходных данных;
1.2. определить  необходимые измерения;
1.3. рассчитать кластерную модель для индекса РТС;
1.4. построить визуальную графическую модель кластеров индекса РТС;
2. произвести анализ построенной кластерной модели индекса РТС; 
2.1. выяснить наличие и силу связи между кластерами;
2.2. построить графическое представление содержимого кластеров;
2.3. получить вероятности того, что значение входного атрибута попадет в кластер;
2.4. выявить различия между кластерами с низким и высоким индексом РТС.
Описание слайда:
Рассмотрим многофакторную модель анализа индекса РТС Задачи, решаемые в процессе кластеризации выглядят следующим образом: 1. построить кластерную модель индекса РТС; 1.1. произвести подсоединение к многомерному хранилищу (кубу) как к источнику исходных данных; 1.2. определить необходимые измерения; 1.3. рассчитать кластерную модель для индекса РТС; 1.4. построить визуальную графическую модель кластеров индекса РТС; 2. произвести анализ построенной кластерной модели индекса РТС; 2.1. выяснить наличие и силу связи между кластерами; 2.2. построить графическое представление содержимого кластеров; 2.3. получить вероятности того, что значение входного атрибута попадет в кластер; 2.4. выявить различия между кластерами с низким и высоким индексом РТС.

Слайд 19





Пример кластеризации
Описание слайда:
Пример кластеризации

Слайд 20





Перемещая движок All Links  вверх или вниз, можно просмотреть наличие сильных и слабых связей между кластерами
Описание слайда:
Перемещая движок All Links вверх или вниз, можно просмотреть наличие сильных и слабых связей между кластерами

Слайд 21





Панель Cluster Discrimination
Описание слайда:
Панель Cluster Discrimination

Слайд 22





4. Построение модели добычи данных
Описание слайда:
4. Построение модели добычи данных

Слайд 23





Выбор команды «Новая модель данных»
Описание слайда:
Выбор команды «Новая модель данных»

Слайд 24





 Выбор способа хранения исходных данных
Описание слайда:
Выбор способа хранения исходных данных

Слайд 25





Выбор куба для дальнейшего анализа
Описание слайда:
Выбор куба для дальнейшего анализа

Слайд 26





Выбор алгоритма DataMining
Описание слайда:
Выбор алгоритма DataMining

Слайд 27





Выбор уровня измерения для многомерной модели
Описание слайда:
Выбор уровня измерения для многомерной модели

Слайд 28





Выбор атрибутов
Описание слайда:
Выбор атрибутов

Слайд 29





Разделение атрибутов
Описание слайда:
Разделение атрибутов

Слайд 30





Ввод имени модели
Описание слайда:
Ввод имени модели

Слайд 31





Список моделей Data Mining
Описание слайда:
Список моделей Data Mining

Слайд 32





Расчет модели
В панели MS_Solution Explorer щелкните правой кнопкой мыши на имени модели и из контекстного меню выберите Process Model... (Процессинг модели...)
Описание слайда:
Расчет модели В панели MS_Solution Explorer щелкните правой кнопкой мыши на имени модели и из контекстного меню выберите Process Model... (Процессинг модели...)

Слайд 33





Сообщение об окончании процессинга
Описание слайда:
Сообщение об окончании процессинга

Слайд 34





Запуск на иллюстрацию результатов построения модели
Описание слайда:
Запуск на иллюстрацию результатов построения модели

Слайд 35





Вид модели Naive Bayes в виде графа
Описание слайда:
Вид модели Naive Bayes в виде графа

Слайд 36





5. Анализ модели Microsoft Naive Bayes 
Появление первой связи между кластерами
Описание слайда:
5. Анализ модели Microsoft Naive Bayes Появление первой связи между кластерами

Слайд 37





Во вторую очередь появляется влияние уровня средней зарплаты (WAG_R_M)
Описание слайда:
Во вторую очередь появляется влияние уровня средней зарплаты (WAG_R_M)

Слайд 38





В-третьих, появляется влияние добычи полезных ископаемых (в % к январю 1995 года) IMQ C
Описание слайда:
В-третьих, появляется влияние добычи полезных ископаемых (в % к январю 1995 года) IMQ C

Слайд 39





В-четвертых, появляется влияние временного роста и инвестиций в основной капитал в млрд. руб. (Date, INFC M)
Описание слайда:
В-четвертых, появляется влияние временного роста и инвестиций в основной капитал в млрд. руб. (Date, INFC M)

Слайд 40





Влияние показателя «Добыча сырой нефти и газа»
Описание слайда:
Влияние показателя «Добыча сырой нефти и газа»

Слайд 41





Влияние показателя «Индекс промышленности».
Описание слайда:
Влияние показателя «Индекс промышленности».

Слайд 42





Построение модели DataMining по технологии MS SQL Server 2000
Описание слайда:
Построение модели DataMining по технологии MS SQL Server 2000



Похожие презентации
Mypresentation.ru
Загрузить презентацию