🗊Презентация Параллельные алгоритмы вычислительной алгебры. Современные компьютеры

Категория: Математика
Нажмите для полного просмотра!
Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №1Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №2Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №3Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №4Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №5Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №6Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №7Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №8Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №9Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №10Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №11Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №12Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №13Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №14Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №15Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №16Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №17Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №18Параллельные алгоритмы вычислительной алгебры. Современные компьютеры, слайд №19

Вы можете ознакомиться и скачать презентацию на тему Параллельные алгоритмы вычислительной алгебры. Современные компьютеры. Доклад-сообщение содержит 19 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Спецкурс кафедры «Вычислительной математки»
Параллельные алгоритмы вычислительной алгебры
Александр Калинкин
Сергей Гололобов
Описание слайда:
Спецкурс кафедры «Вычислительной математки» Параллельные алгоритмы вычислительной алгебры Александр Калинкин Сергей Гололобов

Слайд 2





Часть 2: Современные компьютеры
История развития компьютеров. 
Особенности современных ЦПУ и графических ускорителей.
Описание слайда:
Часть 2: Современные компьютеры История развития компьютеров. Особенности современных ЦПУ и графических ускорителей.

Слайд 3





История развития компьютеров
Это не есть исторический экскурс в прошлое в классическом понимании:

Человек
Счёты
Механические счёты
Компьютер
Кластер
Многоядерный компьютер
Многоядерный кластер
Неоднородный многоядерный компьютер
Неоднородный многоядерный кластер
Описание слайда:
История развития компьютеров Это не есть исторический экскурс в прошлое в классическом понимании: Человек Счёты Механические счёты Компьютер Кластер Многоядерный компьютер Многоядерный кластер Неоднородный многоядерный компьютер Неоднородный многоядерный кластер

Слайд 4





История развития компьютеров
Человек

Особенности: требует еду, питьё, жильё, необходим отдых, неоднородно обучаем, изобретателен, ...

Пример: Напишите число «пи» до куда сможете...
3,1415926535897932384626433832795

Дополнительные данные (окружение):
100 000 лет назад?
5000 лет назад?
600 лет назад?
100 лет назад?
50 лет назад?
Сейчас? Дорогой арифмометр
Завтра? Очень дорогой арифмометр
В Китае?
В России?

Вопросы устойчивости возникли именно благодаря желанию человека посчитать!

Элементарная вычислительная математика родилась здесь.
Описание слайда:
История развития компьютеров Человек Особенности: требует еду, питьё, жильё, необходим отдых, неоднородно обучаем, изобретателен, ... Пример: Напишите число «пи» до куда сможете... 3,1415926535897932384626433832795 Дополнительные данные (окружение): 100 000 лет назад? 5000 лет назад? 600 лет назад? 100 лет назад? 50 лет назад? Сейчас? Дорогой арифмометр Завтра? Очень дорогой арифмометр В Китае? В России? Вопросы устойчивости возникли именно благодаря желанию человека посчитать! Элементарная вычислительная математика родилась здесь.

Слайд 5





История развития компьютеров
(Механические) Счёты

Особенности:  конечная арфиметика, требуют не сильно квалифицированного оператора, ускоряют процесс вычислений, ...

В России исчезли лет 20 назад. Первая атомная бомба была рассчитана на счётах. Схема Годунова возникла на счётах. 

Главное: позволяют делать вычисления параллельно!

Не имели широкого применения до появления сильной нужды в моделировании. Дополнительно: появилась нужда в оптимизации вычислений на основе аналитических рассуждений.
Описание слайда:
История развития компьютеров (Механические) Счёты Особенности: конечная арфиметика, требуют не сильно квалифицированного оператора, ускоряют процесс вычислений, ... В России исчезли лет 20 назад. Первая атомная бомба была рассчитана на счётах. Схема Годунова возникла на счётах. Главное: позволяют делать вычисления параллельно! Не имели широкого применения до появления сильной нужды в моделировании. Дополнительно: появилась нужда в оптимизации вычислений на основе аналитических рассуждений.

Слайд 6





История развития компьютеров
Компьютер

Особенности:  электрический привод, бинарное предсталение о мире, повторябельность, умение выполнять программы, умение хранить биты, надёжность?...

Острая нужда в оптимизации вычислений в связи с дороговизной машины поначалу.

Именно в этот момент и родилась классическая вычислительная математика, которую вы учите в нашем университете. 

Основная проблема вычислительной математики: минимизировать вычисления (число операций в алгоритме) и минимизировать используемую память (сопряжённые градиенты, например)

Всего 25 лет назад компьютер с 40МБ памяти на диске можно было обменять на автомобиль.
Описание слайда:
История развития компьютеров Компьютер Особенности: электрический привод, бинарное предсталение о мире, повторябельность, умение выполнять программы, умение хранить биты, надёжность?... Острая нужда в оптимизации вычислений в связи с дороговизной машины поначалу. Именно в этот момент и родилась классическая вычислительная математика, которую вы учите в нашем университете. Основная проблема вычислительной математики: минимизировать вычисления (число операций в алгоритме) и минимизировать используемую память (сопряжённые градиенты, например) Всего 25 лет назад компьютер с 40МБ памяти на диске можно было обменять на автомобиль.

Слайд 7





История развития компьютеров
Компьютер

Итак, компьютер это

			   скорость выполнения операций («флопсы»)
			   количество требуемой памяти (байты)

Дополнительно: какие именно операции выполняются, например, схема единственного деления в методе Гаусса

Почему? Деление – это операция, которая не может быть выполнена за ~1 такт в отличие от сложения, умножения, вычитания
Описание слайда:
История развития компьютеров Компьютер Итак, компьютер это скорость выполнения операций («флопсы») количество требуемой памяти (байты) Дополнительно: какие именно операции выполняются, например, схема единственного деления в методе Гаусса Почему? Деление – это операция, которая не может быть выполнена за ~1 такт в отличие от сложения, умножения, вычитания

Слайд 8





История развития компьютеров
Компьютер

Тактовая частота – основная характеристика процессора. Именно она определяет сколько операций (тех операций, что процессор в состоянии исполнять) процессор в состоянии выполнить за секунду. 

С точки зрения вычислительной линейной алгебры вторая основная характеристика – количество операций с плавающей точкой (с вещественными числами), которые может выполнить процессор за 1 такт

Итог:
Flops(Флопс) = floating point operations per second.

Объединение основных характеристик даёт нам главную характеристику с точки зрения вычислительной линейной алгебры – количество операций с плавающей точкой, которые может выполнить процессор.
Описание слайда:
История развития компьютеров Компьютер Тактовая частота – основная характеристика процессора. Именно она определяет сколько операций (тех операций, что процессор в состоянии исполнять) процессор в состоянии выполнить за секунду. С точки зрения вычислительной линейной алгебры вторая основная характеристика – количество операций с плавающей точкой (с вещественными числами), которые может выполнить процессор за 1 такт Итог: Flops(Флопс) = floating point operations per second. Объединение основных характеристик даёт нам главную характеристику с точки зрения вычислительной линейной алгебры – количество операций с плавающей точкой, которые может выполнить процессор.

Слайд 9





История развития компьютеров
Компьютер

Дополнительно: относительно современный процессор может выполнять несколько операций с плавающей точкой за 1 такт параллельно (несколько вычислительных блоков могут работать одновременно и несколько чисел могут обрабатываться на 1 блоке [векторизация]) . Но...
с точки зрения нашей вычислительной математики это не столь важно, об этом заботиться либо компилятор, либо библиотека высокопроизводительных программ. 

Тем не менее, вы должны знать о выравнивании данных:
__declspec(align(128)) /4096 и др. степени 2/
malloc и иже с ним – даёт не выровненные данные
Массивы нужно было выравнивать всегда (до последнего времени)
Описание слайда:
История развития компьютеров Компьютер Дополнительно: относительно современный процессор может выполнять несколько операций с плавающей точкой за 1 такт параллельно (несколько вычислительных блоков могут работать одновременно и несколько чисел могут обрабатываться на 1 блоке [векторизация]) . Но... с точки зрения нашей вычислительной математики это не столь важно, об этом заботиться либо компилятор, либо библиотека высокопроизводительных программ. Тем не менее, вы должны знать о выравнивании данных: __declspec(align(128)) /4096 и др. степени 2/ malloc и иже с ним – даёт не выровненные данные Массивы нужно было выравнивать всегда (до последнего времени)

Слайд 10





История развития компьютеров
Компьютер

Выравнивание (связано с векторизацией, т.е., с SSE, AVX и прочими подобными вещами):


			+(*)


			=


Чтобы выполнять такие операции, адрес «Число 0» должен быть кратен некоторому числу байт равному степени 2 (выровнен на это число байт) – это ускоряет программу и даёт стабильный результат по  производительности на нынче устаревающих процессорах (например, процессоры Интел до Нехалема (Nehalem))
Описание слайда:
История развития компьютеров Компьютер Выравнивание (связано с векторизацией, т.е., с SSE, AVX и прочими подобными вещами): +(*) = Чтобы выполнять такие операции, адрес «Число 0» должен быть кратен некоторому числу байт равному степени 2 (выровнен на это число байт) – это ускоряет программу и даёт стабильный результат по производительности на нынче устаревающих процессорах (например, процессоры Интел до Нехалема (Nehalem))

Слайд 11





История развития компьютеров
Компьютер
Особенности процессорной памяти (кэша)
Состоит из линий и банков (объединение линий)

	

	...



Длина линии – несколько байт (64, например)
Размер банка – от килобайт до мегабайт
Ассоциативность кеша – количество банков (2, 4, 8)
Следствие 1: Избегать НЕ непрерывных обращений к памяти
Следствие 2: Избегать обращений к памяти кратных размеру кэша
Описание слайда:
История развития компьютеров Компьютер Особенности процессорной памяти (кэша) Состоит из линий и банков (объединение линий) ... Длина линии – несколько байт (64, например) Размер банка – от килобайт до мегабайт Ассоциативность кеша – количество банков (2, 4, 8) Следствие 1: Избегать НЕ непрерывных обращений к памяти Следствие 2: Избегать обращений к памяти кратных размеру кэша

Слайд 12





История развития компьютеров
Компьютер

Дополнительно:



Скорость  доставки данных растёт на порядок медленнее, чем скорость обработки оных данных (флопсы)

Появляется необходимость минимизировать пересылки из\в память и эксплуатировать параллелизм вычислений и (более медленной!) доставки данных
Описание слайда:
История развития компьютеров Компьютер Дополнительно: Скорость доставки данных растёт на порядок медленнее, чем скорость обработки оных данных (флопсы) Появляется необходимость минимизировать пересылки из\в память и эксплуатировать параллелизм вычислений и (более медленной!) доставки данных

Слайд 13





История развития компьютеров
Кластер


						...





Особенности: необходимость управлять разделёнными данными, учёт скорости обмена данными, ...

Та же самая проблема, что и в отдельном процессоре – скорость передачи данных мала по сравнению с вычислительными возможностями
Описание слайда:
История развития компьютеров Кластер ... Особенности: необходимость управлять разделёнными данными, учёт скорости обмена данными, ... Та же самая проблема, что и в отдельном процессоре – скорость передачи данных мала по сравнению с вычислительными возможностями

Слайд 14





История развития компьютеров
Многоядерный компьютер
Описание слайда:
История развития компьютеров Многоядерный компьютер

Слайд 15





История развития компьютеров
Многоядерный кластер






Разные скорости доступа до разных участков памяти
Описание слайда:
История развития компьютеров Многоядерный кластер Разные скорости доступа до разных участков памяти

Слайд 16





История развития компьютеров
Неоднородный многоядерный компьютер
Неоднородный многоядерный кластер

То же самое, что и обычный многоядерный компьютер\кластер, только ядра могут иметь разные характеристики в пределах одного компьютера
Описание слайда:
История развития компьютеров Неоднородный многоядерный компьютер Неоднородный многоядерный кластер То же самое, что и обычный многоядерный компьютер\кластер, только ядра могут иметь разные характеристики в пределах одного компьютера

Слайд 17





История развития компьютеров
Итог:

Компьютер – это иерархия вычислительных модулей, иерархия памяти и связи между ними, работающие с существенно разными скоростями. 

Дополнительно: графические карты – это тот же процессор с памятью. Сейчас в состоянии работать независимо от существования ЦПУ, в противном случае порождают неоднородный компьютер, где характеристики ЦПУ (мало ядер, но они много умеют) отличаются от характеристик карты (много ядер, но они мало что умеют)
Описание слайда:
История развития компьютеров Итог: Компьютер – это иерархия вычислительных модулей, иерархия памяти и связи между ними, работающие с существенно разными скоростями. Дополнительно: графические карты – это тот же процессор с памятью. Сейчас в состоянии работать независимо от существования ЦПУ, в противном случае порождают неоднородный компьютер, где характеристики ЦПУ (мало ядер, но они много умеют) отличаются от характеристик карты (много ядер, но они мало что умеют)

Слайд 18





Резюме
Вычислительные метдоы существуют с тех пор, как человек научился считать

Компьютеров много и разных – сначала нужно узнать, что за компьютер вам достался

Компьютер = процессор (Флопсы) + память (байты) + провода (биты в секунду)

Выравнивайте данные (массивы)

Избегайте последовательных обращений в массивах кратных размеру кэша (степень 2!)

Избегать НЕ непрерывных обращений к памяти
Описание слайда:
Резюме Вычислительные метдоы существуют с тех пор, как человек научился считать Компьютеров много и разных – сначала нужно узнать, что за компьютер вам достался Компьютер = процессор (Флопсы) + память (байты) + провода (биты в секунду) Выравнивайте данные (массивы) Избегайте последовательных обращений в массивах кратных размеру кэша (степень 2!) Избегать НЕ непрерывных обращений к памяти

Слайд 19





Задания на понимание
Найдите и проанализируйте схему ЦПУ на предмет особенностей
Найдите и проанализируйте схему графической карты на предмет особенностей
Посчитайте, сколько операций использующих У чисел каждая и занимающих 1 такт нужно проделать над К числами находящимися в памяти на процессоре, работающем на частоте М ГГц, чтобы за это время успеть загрузить в ту же память ещё К чисел по каналу, работающему со скоростью С бит в секунду.
Решите задачу 3 с двумя каналами в память идущими последовательно друг за другом, первый из которых работает со скоростью С1 бит\секунду, а второй С2 бит\секунду. 
Пусть из процессора с частотой М ГГц идут два канала в память, последовательно друг за другом, первый из которых работает со скоростью С1 бит\секунду, а второй С2 бит\секунду. Между этими каналами есть память размером в Т чисел. Сколько времени число должно находиться в промежуточной памяти, чтобы второй канал не простаивал.
Описание слайда:
Задания на понимание Найдите и проанализируйте схему ЦПУ на предмет особенностей Найдите и проанализируйте схему графической карты на предмет особенностей Посчитайте, сколько операций использующих У чисел каждая и занимающих 1 такт нужно проделать над К числами находящимися в памяти на процессоре, работающем на частоте М ГГц, чтобы за это время успеть загрузить в ту же память ещё К чисел по каналу, работающему со скоростью С бит в секунду. Решите задачу 3 с двумя каналами в память идущими последовательно друг за другом, первый из которых работает со скоростью С1 бит\секунду, а второй С2 бит\секунду. Пусть из процессора с частотой М ГГц идут два канала в память, последовательно друг за другом, первый из которых работает со скоростью С1 бит\секунду, а второй С2 бит\секунду. Между этими каналами есть память размером в Т чисел. Сколько времени число должно находиться в промежуточной памяти, чтобы второй канал не простаивал.



Похожие презентации
Mypresentation.ru
Загрузить презентацию