🗊Самоорганизация в сети Веб

Категория: Информатика
Нажмите для полного просмотра!
Самоорганизация  в сети Веб, слайд №1Самоорганизация  в сети Веб, слайд №2Самоорганизация  в сети Веб, слайд №3Самоорганизация  в сети Веб, слайд №4Самоорганизация  в сети Веб, слайд №5Самоорганизация  в сети Веб, слайд №6Самоорганизация  в сети Веб, слайд №7Самоорганизация  в сети Веб, слайд №8Самоорганизация  в сети Веб, слайд №9Самоорганизация  в сети Веб, слайд №10Самоорганизация  в сети Веб, слайд №11Самоорганизация  в сети Веб, слайд №12Самоорганизация  в сети Веб, слайд №13Самоорганизация  в сети Веб, слайд №14Самоорганизация  в сети Веб, слайд №15Самоорганизация  в сети Веб, слайд №16Самоорганизация  в сети Веб, слайд №17

Вы можете ознакомиться и скачать Самоорганизация в сети Веб. Презентация содержит 17 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Самоорганизация 
в сети Веб
Описание слайда:
Самоорганизация в сети Веб

Слайд 2





Регулярность в распределении гиперссылок
		Исследования показали, что гиперссылки в сети Веб не подчиняются модели независимой случайной генерации. В первом приближении вероятность появления новой ссылки у страницы подчиняется степенному закону:
Описание слайда:
Регулярность в распределении гиперссылок Исследования показали, что гиперссылки в сети Веб не подчиняются модели независимой случайной генерации. В первом приближении вероятность появления новой ссылки у страницы подчиняется степенному закону:

Слайд 3





Модель предпочтительного прикрепления
Вновь возникающий узел веб-графа устанавливает соединения с уже существующими узлами не равновероятно,  но с большей вероятностью с узлами, имеющими большое количество связей. 
“Победителям достается все”.
Описание слайда:
Модель предпочтительного прикрепления Вновь возникающий узел веб-графа устанавливает соединения с уже существующими узлами не равновероятно, но с большей вероятностью с узлами, имеющими большое количество связей. “Победителям достается все”.

Слайд 4





Модель предпочтительного прикрепления
Описание слайда:
Модель предпочтительного прикрепления

Слайд 5





Модель предпочтительного прикрепления
Описание слайда:
Модель предпочтительного прикрепления

Слайд 6





Модель веб-графа “бабочка”
Описание слайда:
Модель веб-графа “бабочка”

Слайд 7





Модель “бабочка”
В 1999 г. Было проведено исследование структуры веб-графа, содержащего около 200 млн. узлов. В результате исследования было обнаружено центральное сильной связное ядро (SCC), подграф, содержащий только направленные ссылки на ядро (IN), подграф, содержащий только направленные ссылки из ядра (OUT), относительно изолированные “отростки”, связанные с одной из трех крупных компонент, названных выше.   	Имелись также полностью изолированные компоненты, не имевшие связей с названными выше компонентами.
Описание слайда:
Модель “бабочка” В 1999 г. Было проведено исследование структуры веб-графа, содержащего около 200 млн. узлов. В результате исследования было обнаружено центральное сильной связное ядро (SCC), подграф, содержащий только направленные ссылки на ядро (IN), подграф, содержащий только направленные ссылки из ядра (OUT), относительно изолированные “отростки”, связанные с одной из трех крупных компонент, названных выше. Имелись также полностью изолированные компоненты, не имевшие связей с названными выше компонентами.

Слайд 8





Веб-сообщества
Неформально веб-сообщество определяется как подграф веб-графа, в котором плотность внутренних связей превышает плотность внешних связей.
Формальное определение:  Веб-сообщество есть подмножество вершин                , таких, что для всех вершин             ,  v имеет множество рёбер, соединяющих её с вершинами в C и практически не имеет рёбер, соединяющих с вершинами в (V \ C) .
Данная задача является NP-полной.
Описание слайда:
Веб-сообщества Неформально веб-сообщество определяется как подграф веб-графа, в котором плотность внутренних связей превышает плотность внешних связей. Формальное определение: Веб-сообщество есть подмножество вершин , таких, что для всех вершин , v имеет множество рёбер, соединяющих её с вершинами в C и практически не имеет рёбер, соединяющих с вершинами в (V \ C) . Данная задача является NP-полной.

Слайд 9





“Зерновые” веб-ресурсы
Тем не менее, если исходить из факта существования одного или более “зерновых” веб-ресурсов и использовать систематические закономерности в структуре веб-графа, задача может быть сформулирована в виде, который позволяет эффективно идентифицировать веб-сообщества. Под “зерновым” понимают веб-ресурс (веб-страницу), который является признанным авторитетом в тематической области идентифицируемого веб-сообщества и однозначно ему принадлежит.
Описание слайда:
“Зерновые” веб-ресурсы Тем не менее, если исходить из факта существования одного или более “зерновых” веб-ресурсов и использовать систематические закономерности в структуре веб-графа, задача может быть сформулирована в виде, который позволяет эффективно идентифицировать веб-сообщества. Под “зерновым” понимают веб-ресурс (веб-страницу), который является признанным авторитетом в тематической области идентифицируемого веб-сообщества и однозначно ему принадлежит.

Слайд 10





Веб-сообщества
Решение задачи о поиске веб-сообщества сводится к задаче поиска минимально сечения для потока в сети.
Описание слайда:
Веб-сообщества Решение задачи о поиске веб-сообщества сводится к задаче поиска минимально сечения для потока в сети.

Слайд 11





Направленное извлечение сообщества и построение графа
Описание слайда:
Направленное извлечение сообщества и построение графа

Слайд 12





Направленное извлечение сообщества и построение графа
Начиная с зерновых веб-страниц (b), находятся все страницы, которые ссылаются или на которые ссылается зерновое подмножество страниц. 
Исходящие ссылки извлекаются при анализе HTML-кода страницы. 
Входящие ссылки находятся путём запроса к поисковому сервису, который поддерживает модификатор “link”.
Описание слайда:
Направленное извлечение сообщества и построение графа Начиная с зерновых веб-страниц (b), находятся все страницы, которые ссылаются или на которые ссылается зерновое подмножество страниц. Исходящие ссылки извлекаются при анализе HTML-кода страницы. Входящие ссылки находятся путём запроса к поисковому сервису, который поддерживает модификатор “link”.

Слайд 13





Направленное извлечение сообщества и построение графа
Как только URL из множества (c) идентифицированы, их HTML скачиваются и все исходящие ссылки запоминаются. Некоторые из этих исходящих ссылок могут ссылаться на страницы уже посещённые (такие как ссылки из (с) на (c) и (c) на (b)); тем не менее, большинство  исходящих ссылок из (c) ведут на ещё не скаченные страницы (из множества (d)). Страницы, составляющие множество (d) фактически являются эффективно очищенной составной вершиной стока, т.к. каждая из них ссылается на вершину виртуального стока.
Описание слайда:
Направленное извлечение сообщества и построение графа Как только URL из множества (c) идентифицированы, их HTML скачиваются и все исходящие ссылки запоминаются. Некоторые из этих исходящих ссылок могут ссылаться на страницы уже посещённые (такие как ссылки из (с) на (c) и (c) на (b)); тем не менее, большинство исходящих ссылок из (c) ведут на ещё не скаченные страницы (из множества (d)). Страницы, составляющие множество (d) фактически являются эффективно очищенной составной вершиной стока, т.к. каждая из них ссылается на вершину виртуального стока.

Слайд 14





Алгоритм для выделения веб-сообществ (Flake-Lawrence-Giles )
Описание слайда:
Алгоритм для выделения веб-сообществ (Flake-Lawrence-Giles )

Слайд 15





Альтернативные подходы к поиску веб-сообществ
На основе классического алгоритма HITS
На основе HITS с использованием неглавных собственных векторов
На основе комбинированного HITS и латентно-семантического анализа
На основе комбинирования анализа гиперссылок с помощью SALSA и анализа текста с помощью tf-idf метрики.
Описание слайда:
Альтернативные подходы к поиску веб-сообществ На основе классического алгоритма HITS На основе HITS с использованием неглавных собственных векторов На основе комбинированного HITS и латентно-семантического анализа На основе комбинирования анализа гиперссылок с помощью SALSA и анализа текста с помощью tf-idf метрики.

Слайд 16





Литература
A. Broder, R. Kumar, F. Maghoul, P. Raghavan, S. Rajagopalan, R. Stata, A. Tomkins, and J.Wiener. “Graph structure in the Web: Experiments and models”. In WWW9, pp. 309–320, Amsterdam, May 2000. Elsevier Science. 
S. Chakrabarti	“Mining the Web. Discovering Knowledge from Hypertext” Data. Morgan Kaufmann Publishers, 2003.
G. W. Flake, S. R. Lawrence, C. L. Giles, and F. M. Coetzee. Self-Organization and Identification of Web Communities. IEEE Computer, 35(3), 66–71, 2002
N. Imafuji and M. Kitsuregawa, "Finding a web community by maximum flow algorithm with hits score based capacity." In 8th International Conference on Database Systems for Advanced Applications, pp. 101–106, 2003.
Описание слайда:
Литература A. Broder, R. Kumar, F. Maghoul, P. Raghavan, S. Rajagopalan, R. Stata, A. Tomkins, and J.Wiener. “Graph structure in the Web: Experiments and models”. In WWW9, pp. 309–320, Amsterdam, May 2000. Elsevier Science. S. Chakrabarti “Mining the Web. Discovering Knowledge from Hypertext” Data. Morgan Kaufmann Publishers, 2003. G. W. Flake, S. R. Lawrence, C. L. Giles, and F. M. Coetzee. Self-Organization and Identification of Web Communities. IEEE Computer, 35(3), 66–71, 2002 N. Imafuji and M. Kitsuregawa, "Finding a web community by maximum flow algorithm with hits score based capacity." In 8th International Conference on Database Systems for Advanced Applications, pp. 101–106, 2003.

Слайд 17





Литература
J. Kleinberg, S. Lawrence. “The structure of the Web” // Science, vol 294, November 2001. pp. 1849-185.
Майника Э. Алгоритмы оптимизации на сетях и графах. – М.: «Мир», 1981. – 323 с.
G. Flake, S. Lawrence, and C. L. Giles. “Efficient identification of web communities”. In 6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 150–160, 2000.
R. Kumar, P. Raghavan, S. Rajagopalan, and A. Tomkins. “Trawling the Web for emerging cyber-communities”. In Proceedings of the 8th International World Wide Web Conference, pp. 1481–1493, 1999.
A.P. Dempster, N.M. Laird, and D.B. Rubin. “Maximum likelihood from incomplete data via the EM algorithm”. J. R. Statist. Soc. B, 39:185-197, 1977.
Д.Д. Козлов, А.А. Белова. “Исследование эффективности применения методов совместного анализа текстов и гиперссылок для поиска тематических сообществ”.
Описание слайда:
Литература J. Kleinberg, S. Lawrence. “The structure of the Web” // Science, vol 294, November 2001. pp. 1849-185. Майника Э. Алгоритмы оптимизации на сетях и графах. – М.: «Мир», 1981. – 323 с. G. Flake, S. Lawrence, and C. L. Giles. “Efficient identification of web communities”. In 6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 150–160, 2000. R. Kumar, P. Raghavan, S. Rajagopalan, and A. Tomkins. “Trawling the Web for emerging cyber-communities”. In Proceedings of the 8th International World Wide Web Conference, pp. 1481–1493, 1999. A.P. Dempster, N.M. Laird, and D.B. Rubin. “Maximum likelihood from incomplete data via the EM algorithm”. J. R. Statist. Soc. B, 39:185-197, 1977. Д.Д. Козлов, А.А. Белова. “Исследование эффективности применения методов совместного анализа текстов и гиперссылок для поиска тематических сообществ”.



Похожие презентации
Mypresentation.ru
Загрузить презентацию