Европа создала эксафлопсный суперкомпьютер Jupiter: рекордная энергоэффективность и КПД в 85% не избавили проект от зависимости от Nvidia

В списке Top500 суперкомпьютеров за июнь состоялся дебют новой системы эксафлопсного класса — Jupiter из исследовательского центра Юлиха (Германия). Несмотря на то, что вся конфигурация машины ещё не раскрыта, уже известны основные технические характеристики и показатели производительности.

Jupiter стал первой эксафлопсной системой, созданной в рамках инициативы EuroHPC Европейского союза. Хотя изначально планировалось использовать европейские технологии, проект в основном реализован на платформе Nvidia, включая будущую систему хранения. Это подчёркивает проблемы, с которыми сталкивается ЕС на пути к технологической независимости. Однако часть системы, модуль Universal Cluster, работает на серверных процессорах Rhea1 с архитектурой Arm от компании SiPearl, что является шагом к уменьшению зависимости от зарубежных технологий.


Европа создала эксафлопсный суперкомпьютер Jupiter: рекордная энергоэффективность и КПД в 85% не избавили проект от зависимости от Nvidia
Источник: Eviden, ParTec / EuroHPC

Созданием Jupiter занимались компании Eviden (подразделение Atos по суперкомпьютерам) и немецкая ParTec. Как и его предшественник, суперкомпьютер Juwels, запущенный в 2018 году, Jupiter построен по гибридной схеме, сочетающей CPU-, GPU-вычисления, блоки хранения и ускорения. Модуль GPU Booster, оснащённый процессорами Nvidia Grace G100 и ускорителями Hopper H200, занял четвёртое место в июньском Top500 благодаря тесту High Performance Linpack (HPL).

Архитектура GPU Booster основана на четырёхъядерных кластерах: четыре GPU Hopper H200 выступают как контроллеры NUMA, объединяя четыре CPU и четыре GPU в единый узел из восьми компонентов. Каждый H200 оснащён 96 ГБ памяти HBM3 с пропускной способностью 4 ТБ/с. Связь между GPU осуществляется через NVLink 4 (300 ГБ/с), а между GPU и CPU — 600 ГБ/с. Каждый узел содержит два таких модуля.

Модуль Universal Cluster включает более 1300 узлов с двумя чипами Rhea1 (80 ядер Zeus Neoverse V1 каждый, схожих с Amazon Graviton3). Его ожидаемая производительность в тесте HPL — 5 петафлопс (FP64), что существенно ниже показателей GPU Booster. Изначально планировалось, что Jupiter будет включать 5000 GPU-узлов (20 000 чипов Grace/Hopper), 1000 CPU-узлов (2000 Rhea1), 20 ПБ флеш-памяти и 300 ПБ дискового хранилища, но финальная конфигурация оказалась иной.

В актуальной конфигурации GPU Booster задействовано около 23 536 чипов Grace-Hopper, что обеспечило производительность 793.4 петафлопс (Rmax) при пиковой мощности 930 петафлопс (Rpeak). Цель в 1 эксафлопс пока не достигнута, но эффективность HPL-вычислений (85.3%) значительно превосходит аналоги от HPE (77.7–53.2%). Энергоэффективность системы составила 60 гигафлопс на ватт, соответствуя лучшим мировым стандартам.

Общая стоимость проекта Jupiter оценивается в €500 млн (без учёта хранилищ), из которых €273 млн было направлено на оборудование и услуги компаний Eviden и ParTec. Несмотря на зависимость от решений Nvidia и отклонение от изначальных планов, Jupiter демонстрирует прогресс Европы в области высокопроизводительных вычислений, сочетая высокую производительность с энергоэффективностью.

 

Источник: iXBT

Читайте также