Разработчики: | Nvidia (Нвидиа) |
Дата премьеры системы: | 2022/03/25 |
Отрасли: | Электротехника и микроэлектроника |
Технологии: | Процессоры |
Основные статьи:
2022: Анонс кремниевой архитектуры Hopper и созданной на её основе GPU H100
25 марта 2022 года компания NVidia анонсировала целый ряд технологий, ориентированных на использование в сфере искусственного интеллекта. В первую очередь, это кремниевая архитектура Hopper, созданный на её основе GPU H100 и «суперпроцессор» Grace CPU.
По информации компании, архитектура и суперпроцессор названы в честь контр-адмирала ВМФ США Грейс Хоппер (Grace Hopper), создательницы первого в истории компилятора компьютерного языка программирования и одного из первых высокоуровневых языков программирования COBOL.
Архитектура Hopper и GPU H100 призваны оптимизировать процесс обучения машинных моделей. Шина NVLink четвёртого поколения позволяет соединять до 256 GPU H100, обеспечивая девятикратный прирост пропускной способности, по сравнению с предыдущими поколениями.
Сам по себе процессор H100 содержит 80 млрд транзисторов. При этом он поддерживает PCIe Gen5 и HBM3; благодаря этому пропускная способность памяти достигает 3 терабайт в секунду. В Nvidia утверждают, что H100 в три-шесть раз превосходит процессор предыдущего поколения A100 в вычислениях с плавающей запятой в зависимости от разрядности.
В зависимости от форм-фактора характеристики GPU будут несколько отличаться. Так, у старшей версии имеется 15 872 ядра CUDA.
Памяти у обеих версий по 80 ГБ, причём это HBM3 с пропускной способностью 2 либо 3 ТБ/с. TDP старшей версии составляет 700 Вт, тогда как у модификации с PCIe 5.0 показатель вдвое меньше.
Производительность версии SXM5 достигает 30 TFLOPS (FP64), 60 TFLOPS (FP32), а у версии PCIe 5.0 показатели соответственно равны 24 и 48 TFLOPS. Также стоит отметить интерфейс NVLink, который в том же порядке обеспечивает скорость передачи данных в 900 либо 600 ГБ/с.
Что касается Grace CPU, то это фактически два процессора, соединённых шиной NVLink-C2C. Grace предназначен для использования в «гипермасштабных высокопроизводительных вычислениях и сфере ИИ» в комплекте с H100 или самостоятельно. Процессор насчитывает 144 ядер Arm, а его пропускная способность составляет 1 терабайт в секунду[1].
Архитектура Hopper приносит на рынок и тензорные ядра четвёртого поколения, которые в девять раз быстрее предыдущего поколения в ряде задач машинного обучения. Отдельно в Nvidia отметили набор инструкций DPX, который поможет разработчикам писать код для ускорения алгоритмов динамического программирования в различных отраслях, ускоряя рабочие процессы для диагностики заболеваний, квантового моделирования, анализа графов и оптимизации маршрутизации.
Системы на основе решений Hopper будут доступны партнёрам Nvidia в третьем квартале[2].
Примечания
Подрядчики-лидеры по количеству проектов
Т1 Интеграция (ранее Техносерв) (4)
МЦСТ (4)
Микрон (Mikron) (4)
Lenovo (4)
ИНЭУМ им. И.С. Брука (3)
Другие (48)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
МЦСТ (8, 22)
Микрон (Mikron) (2, 9)
Oracle (1, 7)
Nvidia (Нвидиа) (17, 6)
Intel (36, 5)
Другие (193, 15)
Байкал Электроникс (Baikal Electronics) (1, 2)
Intel (1, 1)
Huawei (1, 1)
Nvidia (Нвидиа) (1, 1)
Микрон (Mikron) (1, 1)
Другие (0, 0)
Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)
Эльбрус - 15 (8, 7)
Микрон Интегральные микросхемы MIK - 9 (9, 0)
Oracle SPARC - 7 (7, 0)
Intel Xeon Scalable - 5 (5, 0)
Nvidia Volta - 3 (0, 3)
Другие 7
Baikal-M - 2 (2, 0)
Nvidia Volta - 2 (0, 2)
Микрон Интегральные микросхемы MIK - 1 (1, 0)
Intel Xeon Scalable - 1 (1, 0)
Другие -2