🗊Презентация Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8)

Категория: Технология
Нажмите для полного просмотра!
Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №1Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №2Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №3Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №4Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №5Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №6Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №7Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №8Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №9Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №10Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №11Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №12Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №13Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №14Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №15Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №16Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №17Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №18Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №19Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №20Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №21Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №22Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №23Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №24Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №25Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №26Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №27Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №28Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №29Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №30Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №31Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №32Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №33Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №34Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №35Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №36Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №37Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №38Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8), слайд №39

Содержание

Вы можете ознакомиться и скачать презентацию на тему Архитектура современных ЭВМ. Параллельные вычисления. (Лекция 8). Доклад-сообщение содержит 39 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





АРХИТЕКТУРА СОВРЕМЕННЫХ ЭВМ

Лекция 8:
Параллельные вычисления
ВМиК МГУ им. М.В. Ломоносова, Кафедра АСВК
Чл.-корр., профессор, д.ф.-м.н. Королёв Л.Н.,
Ассистент Волканов Д.Ю.
Описание слайда:
АРХИТЕКТУРА СОВРЕМЕННЫХ ЭВМ Лекция 8: Параллельные вычисления ВМиК МГУ им. М.В. Ломоносова, Кафедра АСВК Чл.-корр., профессор, д.ф.-м.н. Королёв Л.Н., Ассистент Волканов Д.Ю.

Слайд 2





План лекции
Архитектуры параллельных компьютеров
Параллелизм на уровне команд
Многопоточность
Мультипроцессоры
Мультикомпьютеры
Классификация Флинна
Описание слайда:
План лекции Архитектуры параллельных компьютеров Параллелизм на уровне команд Многопоточность Мультипроцессоры Мультикомпьютеры Классификация Флинна

Слайд 3





Уровни параллелизма
В процессоре 
Конвейризация
Суперскалярность
Удлинение длины команд
Дополнительные специализированные процессоры
Многоядерность
Многопроцессорность (Сильносвязанный параллелизм)
Кластеры (Слабосвязанный параллелизм)
Описание слайда:
Уровни параллелизма В процессоре Конвейризация Суперскалярность Удлинение длины команд Дополнительные специализированные процессоры Многоядерность Многопроцессорность (Сильносвязанный параллелизм) Кластеры (Слабосвязанный параллелизм)

Слайд 4





Архитектуры параллельных компьютеров
(a) На чипе (b) Сопроцессор (c)Мультипроцессор
(d) Мультикомпьютер (e) Грид
Описание слайда:
Архитектуры параллельных компьютеров (a) На чипе (b) Сопроцессор (c)Мультипроцессор (d) Мультикомпьютер (e) Грид

Слайд 5





Параллелизм на уровне команд
(a) Конвейер (b) Посл-ть VLIW инструкций
(c) Поток команд с отмеченными связками
Описание слайда:
Параллелизм на уровне команд (a) Конвейер (b) Посл-ть VLIW инструкций (c) Поток команд с отмеченными связками

Слайд 6





TriMedia VLIW команда
Типичная команда TriMedia.
Описание слайда:
TriMedia VLIW команда Типичная команда TriMedia.

Слайд 7





Функциональные блоки
Операции с константами (5)
АЛУ целочисленных операций (5)
Сдвиги (2)
Загрузка и сохранение из памяти (2)
Умножение целых и вещественных чисел (2)
АЛУ операций с плавающей точкой (2)
Сравнение чисел с плавающей точкой (1)
Извлечение квадратного корня (1)
Ветвления (3)
АЛУ ЦОС (2)
Умножитель для ЦОС (2)
Описание слайда:
Функциональные блоки Операции с константами (5) АЛУ целочисленных операций (5) Сдвиги (2) Загрузка и сохранение из памяти (2) Умножение целых и вещественных чисел (2) АЛУ операций с плавающей точкой (2) Сравнение чисел с плавающей точкой (1) Извлечение квадратного корня (1) Ветвления (3) АЛУ ЦОС (2) Умножитель для ЦОС (2)

Слайд 8





Особенности
Арифметика с насыщением
Команды 2-28 байт
Отсутствует проверка на совместимость операций во время исполнения
Прогнозирование операций
Специализированные операции
Описание слайда:
Особенности Арифметика с насыщением Команды 2-28 байт Отсутствует проверка на совместимость операций во время исполнения Прогнозирование операций Специализированные операции

Слайд 9





Внутрипроцессорная многопоточность (1)
(a) – (c) Три потока. Пустые квадраты означают простой в ожидании данных из памяти  (d) Мелкомодульная многопоточность 
(e) Крупномодульная многопоточность
Описание слайда:
Внутрипроцессорная многопоточность (1) (a) – (c) Три потока. Пустые квадраты означают простой в ожидании данных из памяти (d) Мелкомодульная многопоточность (e) Крупномодульная многопоточность

Слайд 10





Внутрипроцессорная многопоточность (2)
Многопоточность в сдвоенном процессоре
(a) Мелкомодульная многопоточность
(b) Крупномодульная многопоточность
(c) Синхронная многопоточность
Описание слайда:
Внутрипроцессорная многопоточность (2) Многопоточность в сдвоенном процессоре (a) Мелкомодульная многопоточность (b) Крупномодульная многопоточность (c) Синхронная многопоточность

Слайд 11





Варианты повышения производительности
Повышение тактовой частоты
Размещение на одной микросхеме двух процессоров
Введение новых функциональных блоков
Удлинение конвейера
Использование многопоточности
Описание слайда:
Варианты повышения производительности Повышение тактовой частоты Размещение на одной микросхеме двух процессоров Введение новых функциональных блоков Удлинение конвейера Использование многопоточности

Слайд 12





Стратегии управления совместным потреблением ресурсов
Дублирование ресурсов
Жёсткое разделение ресурсов
Полное разделение ресурсов
Пороговое разделение ресурсов
Описание слайда:
Стратегии управления совместным потреблением ресурсов Дублирование ресурсов Жёсткое разделение ресурсов Полное разделение ресурсов Пороговое разделение ресурсов

Слайд 13





Многопоточность в Pentium 4
Разделение ресурсов между программными потоками в микроархитектуре NetBurst Pentium 4.
Описание слайда:
Многопоточность в Pentium 4 Разделение ресурсов между программными потоками в микроархитектуре NetBurst Pentium 4.

Слайд 14





Гомогенные однокристальные микропроцессоры
Однокристальные мультипроцессоры. 
(a) Два конвейера   (b) Два ядра
Описание слайда:
Гомогенные однокристальные микропроцессоры Однокристальные мультипроцессоры. (a) Два конвейера (b) Два ядра

Слайд 15





Гетерогенные однокристальные мультипроцессоры
Описание слайда:
Гетерогенные однокристальные мультипроцессоры

Слайд 16





Архитектура CoreConnect
An example of the IBM CoreConnect architecture.
Описание слайда:
Архитектура CoreConnect An example of the IBM CoreConnect architecture.

Слайд 17





Мультипроцессоры
(a) Мультипроцессор с 16 ЦПУ, разделяющих общую память
(b) Изображение, разбивается на 16 частей, каждое обрабатывается своим ЦПУ
Описание слайда:
Мультипроцессоры (a) Мультипроцессор с 16 ЦПУ, разделяющих общую память (b) Изображение, разбивается на 16 частей, каждое обрабатывается своим ЦПУ

Слайд 18





Мультикомпьютеры (1)
Описание слайда:
Мультикомпьютеры (1)

Слайд 19





Мультикомпьютеры (2)
Описание слайда:
Мультикомпьютеры (2)

Слайд 20





Классификация Флинна (1)
Описание слайда:
Классификация Флинна (1)

Слайд 21





Классификация Флинна (2)
A taxonomy of parallel computers.
Описание слайда:
Классификация Флинна (2) A taxonomy of parallel computers.

Слайд 22





Классификация вычислительных систем
Мультипроцессоры с использованием единой общей памяти (shared memory)… 
Обеспечивается однородный доступ к памяти (uniform memory access or UMA), 
Являются основой для построения: 
векторных параллельных процессоров (parallel vector processor or PVP). Примеры: Cray T90,
симметричных мультипроцессоров (symmetric multiprocessor or SMP). Примеры: IBM eServer, Sun StarFire, HP Superdome, 
SGI Origin.
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти (shared memory)… Обеспечивается однородный доступ к памяти (uniform memory access or UMA), Являются основой для построения: векторных параллельных процессоров (parallel vector processor or PVP). Примеры: Cray T90, симметричных мультипроцессоров (symmetric multiprocessor or SMP). Примеры: IBM eServer, Sun StarFire, HP Superdome, SGI Origin.

Слайд 23





Классификация вычислительных систем
Мультипроцессоры с использованием единой  общей памяти…
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти…

Слайд 24





Классификация вычислительных систем
Мультипроцессоры с использованием единой общей памяти… 
Проблемы:
Доступ с разных процессоров к общим данным и обеспечение, в этой связи, однозначности (когерентности) содержимого разных кэшей 
(cache coherence problem),
Необходимость синхронизации взаимодействия одновременно выполняемых  потоков команд
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти… Проблемы: Доступ с разных процессоров к общим данным и обеспечение, в этой связи, однозначности (когерентности) содержимого разных кэшей (cache coherence problem), Необходимость синхронизации взаимодействия одновременно выполняемых потоков команд

Слайд 25





Классификация вычислительных систем
Мультипроцессоры с использованием единой общей памяти… 
Проблема: Обеспечение однозначности (когерентности) содержимого разных кэшей (cache coherence problem)
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти… Проблема: Обеспечение однозначности (когерентности) содержимого разных кэшей (cache coherence problem)

Слайд 26





Классификация вычислительных систем
Мультипроцессоры с использованием единой общей памяти… 
Проблема: Необходимость синхронизации взаимодействия одновременно выполняемых  потоков команд…
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти… Проблема: Необходимость синхронизации взаимодействия одновременно выполняемых потоков команд…

Слайд 27





Классификация вычислительных систем
Пример: Пусть процессоры выполняют последовательность команд
  
  
над общей переменной N (в скобках указывается значение этой переменной)
              Вариант исполнения 1                           Вариант исполнения 2
Описание слайда:
Классификация вычислительных систем Пример: Пусть процессоры выполняют последовательность команд над общей переменной N (в скобках указывается значение этой переменной) Вариант исполнения 1 Вариант исполнения 2

Слайд 28





Классификация вычислительных систем
Мультипроцессоры с использованием единой общей памяти… 
Проблема: Необходимость синхронизации взаимодействия одновременно выполняемых  потоков команд…
Рассмотренный пример может рассматриваться как проявление общей проблемы использования разделяемых ресурсов (общих данных, файлов, устройств и т.п.)
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти… Проблема: Необходимость синхронизации взаимодействия одновременно выполняемых потоков команд… Рассмотренный пример может рассматриваться как проявление общей проблемы использования разделяемых ресурсов (общих данных, файлов, устройств и т.п.)

Слайд 29





Классификация вычислительных систем
Для организации разделения ресурсов между несколькими потоками команд необходимо иметь возможность:
        - определения доступности запрашиваемых ресурсов (ресурс свободен и может быть выделен для использования, ресурс уже занят одним из потоков и не может использоваться дополнительно каким-либо другим потоком);
        - выделения свободного ресурса одному из процессов, запросивших ресурс для использования;
        - приостановки (блокировки) потоков, выдавших запросы на ресурсы, занятые другими потоками.
Описание слайда:
Классификация вычислительных систем Для организации разделения ресурсов между несколькими потоками команд необходимо иметь возможность: - определения доступности запрашиваемых ресурсов (ресурс свободен и может быть выделен для использования, ресурс уже занят одним из потоков и не может использоваться дополнительно каким-либо другим потоком); - выделения свободного ресурса одному из процессов, запросивших ресурс для использования; - приостановки (блокировки) потоков, выдавших запросы на ресурсы, занятые другими потоками.

Слайд 30





Классификация вычислительных систем
Мультипроцессоры с использованием единой общей памяти 
Проблема: Необходимость синхронизации взаимодействия одновременно выполняемых  потоков команд
Доступ к общей переменной в рассмотренном примере в самом общем виде должен быть организован следующим образом:
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием единой общей памяти Проблема: Необходимость синхронизации взаимодействия одновременно выполняемых потоков команд Доступ к общей переменной в рассмотренном примере в самом общем виде должен быть организован следующим образом:

Слайд 31





Классификация вычислительных систем
Мультипроцессоры с использованием физически распределенной памяти (distributed shared memory or DSM):
Неоднородный доступ к памяти (non-uniform memory access or NUMA), 
Среди систем такого типа выделяют:
cache-only memory architecture or COMA (системы KSR-1 и DDM),
cache-coherent NUMA or CC-NUMA (системы SGI Origin 2000, Sun HPC 10000, IBM/Sequent NUMA-Q 2000),
non-cache coherent NUMA or NCC-NUMA (система Cray T3E).
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием физически распределенной памяти (distributed shared memory or DSM): Неоднородный доступ к памяти (non-uniform memory access or NUMA), Среди систем такого типа выделяют: cache-only memory architecture or COMA (системы KSR-1 и DDM), cache-coherent NUMA or CC-NUMA (системы SGI Origin 2000, Sun HPC 10000, IBM/Sequent NUMA-Q 2000), non-cache coherent NUMA or NCC-NUMA (система Cray T3E).

Слайд 32





Классификация вычислительных систем
Мультипроцессоры с использованием физически распределенной памяти…
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием физически распределенной памяти…

Слайд 33





Классификация вычислительных систем
Мультипроцессоры с использованием физически распределенной памяти:
Упрощаются проблемы создания мультипроцессоров (известны примеры систем с несколькими тысячами процессоров)
Возникают проблемы эффективного использования распределенной памяти (время доступа к локальной и удаленной памяти может различаться на несколько порядков).
Описание слайда:
Классификация вычислительных систем Мультипроцессоры с использованием физически распределенной памяти: Упрощаются проблемы создания мультипроцессоров (известны примеры систем с несколькими тысячами процессоров) Возникают проблемы эффективного использования распределенной памяти (время доступа к локальной и удаленной памяти может различаться на несколько порядков).

Слайд 34





Мультикомпьютеры…
Мультикомпьютеры…
Не обеспечивают общий доступ ко всей имеющейся в системах памяти (no-remote memory access or NORMA),
Каждый процессор системы может использовать только свою локальную память
Описание слайда:
Мультикомпьютеры… Мультикомпьютеры… Не обеспечивают общий доступ ко всей имеющейся в системах памяти (no-remote memory access or NORMA), Каждый процессор системы может использовать только свою локальную память

Слайд 35





Мультикомпьютеры
Для доступа к данным, располагаемых на других процессорах, необходимо явно выполнить операции передачи сообщений (message passing operations),
Основные операции передачи данных:
Отправить сообщение (send),
Получить сообщение (receive)
Пример:
Описание слайда:
Мультикомпьютеры Для доступа к данным, располагаемых на других процессорах, необходимо явно выполнить операции передачи сообщений (message passing operations), Основные операции передачи данных: Отправить сообщение (send), Получить сообщение (receive) Пример:

Слайд 36





Мультикомпьютеры
Данный подход используется при построении двух важных типов многопроцессорных вычислительных систем: 
массивно-параллельных систем (massively parallel processor or MPP), например: IBM RS/6000 SP2, Intel PARAGON, ASCI Red, транспьютерные системы Parsytec,
кластеров (clusters), например: AC3 Velocity и NCSA NT Supercluster.
Описание слайда:
Мультикомпьютеры Данный подход используется при построении двух важных типов многопроцессорных вычислительных систем: массивно-параллельных систем (massively parallel processor or MPP), например: IBM RS/6000 SP2, Intel PARAGON, ASCI Red, транспьютерные системы Parsytec, кластеров (clusters), например: AC3 Velocity и NCSA NT Supercluster.

Слайд 37





Кластеры
Преимущества:
Могут быть образованы на базе уже существующих у потребителей отдельных компьютеров, либо же сконструированы из типовых компьютерных элементов; 
Повышение вычислительной мощности отдельных процессоров позволяет строить кластеры из сравнительно небольшого количества отдельных компьютеров (lowly parallel processing),
Для параллельного выполнения в алгоритмах достаточно выделять только крупные независимые части расчетов (coarse granularity).
Описание слайда:
Кластеры Преимущества: Могут быть образованы на базе уже существующих у потребителей отдельных компьютеров, либо же сконструированы из типовых компьютерных элементов; Повышение вычислительной мощности отдельных процессоров позволяет строить кластеры из сравнительно небольшого количества отдельных компьютеров (lowly parallel processing), Для параллельного выполнения в алгоритмах достаточно выделять только крупные независимые части расчетов (coarse granularity).

Слайд 38





Кластеры
Недостатки:
Организация взаимодействия вычислительных узлов кластера при помощи передачи сообщений обычно приводит к значительным временным задержкам
Дополнительные ограничения на тип разрабатываемых параллельных алгоритмов и программ (низкая интенсивность потоков передачи данных)
Описание слайда:
Кластеры Недостатки: Организация взаимодействия вычислительных узлов кластера при помощи передачи сообщений обычно приводит к значительным временным задержкам Дополнительные ограничения на тип разрабатываемых параллельных алгоритмов и программ (низкая интенсивность потоков передачи данных)

Слайд 39





Спасибо за внимание!
Описание слайда:
Спасибо за внимание!



Похожие презентации
Mypresentation.ru
Загрузить презентацию