🗊Презентация Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью

Категория: Математика
Нажмите для полного просмотра!
Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №1Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №2Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №3Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №4Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №5Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №6Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №7Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №8Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №9Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №10Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №11Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №12Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №13Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №14Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №15Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №16Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №17Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №18Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №19Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №20Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №21Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №22Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №23Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №24Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №25Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №26Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №27Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №28Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №29Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №30Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №31Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №32Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №33Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №34Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №35Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №36Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №37Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №38Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №39Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №40Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №41Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №42Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №43Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №44Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №45Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью, слайд №46

Содержание

Вы можете ознакомиться и скачать презентацию на тему Параллельные алгоритмы вычислительной алгебры. Распараллеливание на компьютерах с распределенной памятью. Доклад-сообщение содержит 46 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Спецкурс кафедры «Вычислительной математки»
Параллельные алгоритмы вычислительной алгебры
Александр Калинкин
Сергей Гололобов
Описание слайда:
Спецкурс кафедры «Вычислительной математки» Параллельные алгоритмы вычислительной алгебры Александр Калинкин Сергей Гололобов

Слайд 2





Часть 5: Распараллеливание на компьютерах с распределенной памятью
Linpack
LAPACK
DAG алгоритм
Описание слайда:
Часть 5: Распараллеливание на компьютерах с распределенной памятью Linpack LAPACK DAG алгоритм

Слайд 3





Blas
Basic Linear Algebra Subprograms
- BLAS Level 1 – операции с векторами (скалярное произведение вектор, умножение вектор на скалярную величину, нормы вектора и т.д.)
- BLAS Level 2 – матрично-векторные операции (умножение матрицы разных типов на вектор)
- BLAS Level 3 –  операции с матрицами (перемножение прямоугольных матриц различных типов) 
Опубликован в 1979 году
В свободном доступе на netlib.org
Содержится в оптимизированном виде в огромном количестве математических библиотек (Intel MKL, ACML, ATLAS, и тд)
Описание слайда:
Blas Basic Linear Algebra Subprograms - BLAS Level 1 – операции с векторами (скалярное произведение вектор, умножение вектор на скалярную величину, нормы вектора и т.д.) - BLAS Level 2 – матрично-векторные операции (умножение матрицы разных типов на вектор) - BLAS Level 3 – операции с матрицами (перемножение прямоугольных матриц различных типов) Опубликован в 1979 году В свободном доступе на netlib.org Содержится в оптимизированном виде в огромном количестве математических библиотек (Intel MKL, ACML, ATLAS, и тд)

Слайд 4





Linpack
Linear Algebra Package 
Пакет для решения систем линейных уравнений и задачи о наименьших квадратах
Опубликован в конце 70-х годов Джеком Донгарра с коллективом
В свободном доступе на netlib.org
Впоследствии пакет стал основной замером производительности кластеров, в частности top500 определяются по модификации этого пакета.
Основная функциональность – разложение Холесского, в симметричном случае представление матрицы
Описание слайда:
Linpack Linear Algebra Package Пакет для решения систем линейных уравнений и задачи о наименьших квадратах Опубликован в конце 70-х годов Джеком Донгарра с коллективом В свободном доступе на netlib.org Впоследствии пакет стал основной замером производительности кластеров, в частности top500 определяются по модификации этого пакета. Основная функциональность – разложение Холесского, в симметричном случае представление матрицы

Слайд 5





Разложение Холесского для симметричных матриц
Описание слайда:
Разложение Холесского для симметричных матриц

Слайд 6





Разложение Холесского для симметричных матриц
Описание слайда:
Разложение Холесского для симметричных матриц

Слайд 7





Разложение Холесского для симметричных матриц
Описание слайда:
Разложение Холесского для симметричных матриц

Слайд 8





Разложение Холесского для симметричных матриц
Описание слайда:
Разложение Холесского для симметричных матриц

Слайд 9





Разложение Холесского для симметричных матриц
Описание слайда:
Разложение Холесского для симметричных матриц

Слайд 10





Разложение Холесского для симметричных матриц
Описание слайда:
Разложение Холесского для симметричных матриц

Слайд 11





Разложение Холесского для симметричных матриц
Описание слайда:
Разложение Холесского для симметричных матриц

Слайд 12





Разложение Холесского для симметричных матриц
Описание слайда:
Разложение Холесского для симметричных матриц

Слайд 13





Разложение Холесского для симметричных матриц
Описание слайда:
Разложение Холесского для симметричных матриц

Слайд 14





Linpack
Плюсы: 
Достаточно оптимизировать BLAS level 1 для процессора, чтоб получить оптимизированный Linpack
Минусы: 
При увеличении кэша становится неэффективно умножать только строку на число – кэш значительно больше, есть возможность использовать его более разумно
После каждого использования BLAS level 1 приходится вычислять корень из 1 вещественного числа – неэффективно для современныю процессоров
Blas level 1 не очень хорошо параллелизуется, появление многоядерных процессоров накладывает свои требования
Описание слайда:
Linpack Плюсы: Достаточно оптимизировать BLAS level 1 для процессора, чтоб получить оптимизированный Linpack Минусы: При увеличении кэша становится неэффективно умножать только строку на число – кэш значительно больше, есть возможность использовать его более разумно После каждого использования BLAS level 1 приходится вычислять корень из 1 вещественного числа – неэффективно для современныю процессоров Blas level 1 не очень хорошо параллелизуется, появление многоядерных процессоров накладывает свои требования

Слайд 15





LAPACK
Linear Algebra Package 
Пакет для решения систем линейных уравнений, поиска сингулярных значений матриц, задач о наименьших квадратах и многое другое...
Опубликован в конце 1992 году Джеком Донгарра с коллективом
В свободном доступе на netlib.org
Содержится в оптимизированном виде в огромном количестве математических библиотек (Intel MKL, ACML, ATLAS, и тд)
Содержит параллельную версию разложения Холесского
Описание слайда:
LAPACK Linear Algebra Package Пакет для решения систем линейных уравнений, поиска сингулярных значений матриц, задач о наименьших квадратах и многое другое... Опубликован в конце 1992 году Джеком Донгарра с коллективом В свободном доступе на netlib.org Содержится в оптимизированном виде в огромном количестве математических библиотек (Intel MKL, ACML, ATLAS, и тд) Содержит параллельную версию разложения Холесского

Слайд 16





LAPACK
Описание слайда:
LAPACK

Слайд 17





LAPACK
Плюсы: 
Достаточно оптимизировать BLAS level 3 для процессора, чтоб получить оптимизированное разложение Холесского
Минусы: 
Не такая эффективная работа на процессорах с разным уровнем кэша – постоянно приходится перекачивать данные с уровня на уровень.
Каждый эффективный вызов BLAS level 3 чередуется с неэффективным вызовом LLT разложения для диагонального блока.
При большом числе процессоров возникает ограничение на “шкалирование” вычисления группы столбов – если группа большая, то время на вычисление диагонального блока станосится существенным.
Описание слайда:
LAPACK Плюсы: Достаточно оптимизировать BLAS level 3 для процессора, чтоб получить оптимизированное разложение Холесского Минусы: Не такая эффективная работа на процессорах с разным уровнем кэша – постоянно приходится перекачивать данные с уровня на уровень. Каждый эффективный вызов BLAS level 3 чередуется с неэффективным вызовом LLT разложения для диагонального блока. При большом числе процессоров возникает ограничение на “шкалирование” вычисления группы столбов – если группа большая, то время на вычисление диагонального блока станосится существенным.

Слайд 18





Решение проблемы с диагональным блоком
Описание слайда:
Решение проблемы с диагональным блоком

Слайд 19





Решение проблемы с диагональным блоком
Описание слайда:
Решение проблемы с диагональным блоком

Слайд 20





Решение проблемы с диагональным блоком
Описание слайда:
Решение проблемы с диагональным блоком

Слайд 21





Решение проблемы с диагональным блоком
Описание слайда:
Решение проблемы с диагональным блоком

Слайд 22





Разложение Холесского для симметричных матриц
Описание слайда:
Разложение Холесского для симметричных матриц

Слайд 23





Решение проблемы с диагональным блоком
Описание слайда:
Решение проблемы с диагональным блоком

Слайд 24





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 25





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 26





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 27





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 28





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 29





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 30





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 31





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 32





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 33





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 34





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 35





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 36





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 37





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 38





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 39





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 40





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 41





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 42





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 43





Dag подход (Directed acyclic graph)
Описание слайда:
Dag подход (Directed acyclic graph)

Слайд 44





Dag подход (Directed acyclic graph)
Плюсы: 
Очень хорошая шкалируемость на старте алгоритма
Динамическое распределение задач
Возможность изменения размеров блоков в зависимости от положения в графе
Минусы: 
Слабая шкалируемость на окончании алгоритма
Динамическое распределение задач
Описание слайда:
Dag подход (Directed acyclic graph) Плюсы: Очень хорошая шкалируемость на старте алгоритма Динамическое распределение задач Возможность изменения размеров блоков в зависимости от положения в графе Минусы: Слабая шкалируемость на окончании алгоритма Динамическое распределение задач

Слайд 45





Далее...
 Как реализовать алгорититм для очень большого числа ядер (> 100)?
 Как модифицировать алгоритм в случае большого количества кэшей разного уровня?
 Как выбирать размер блоков в зависимости от процессора/платформы?
Вопросы открыты.....
Описание слайда:
Далее... Как реализовать алгорититм для очень большого числа ядер (> 100)? Как модифицировать алгоритм в случае большого количества кэшей разного уровня? Как выбирать размер блоков в зависимости от процессора/платформы? Вопросы открыты.....

Слайд 46





Вопросы и Ответы
Описание слайда:
Вопросы и Ответы



Похожие презентации
Mypresentation.ru
Загрузить презентацию