Привет! На связи команда mClouds. В октябре мы писали об успехах Intel: несмотря на финансовые неудачи, компания вывела на рынок новый процессор — Intel Xeon 6900P. И вот уже на основе этих процессоров IT-компания NEC собирает суперкомпьютер следующего поколения для японского Национального института квантовой науки и технологии (QST). В систему также включат ускорители AMD Instinct, чтобы достичь производительности 40,4 петафлопса.
Рассказываем, из какого железа будет состоять будущий суперкомпьютер и для какой цели его создают.
Что внутри нового суперкомпьютера
Система включает:
-
360 компьютеров NEC LX 204Bin-3 с 720 процессорами Intel Xeon 6900P;
-
70 компьютеров NEC LX 401Bax-3GA с 280 процессорами AMD Instinct MI300A;
-
модулей памяти MRDIMM DDR5;
-
системы жидкостного охлаждения, разработанной Giga Computing.
В сетевой среде используется InfiniBand с NVIDIA QM9700, программное обеспечение Altair PBS Professional и планировщик, оптимизированный для AMD Instinct MI300A.
Суперкомпьютер оснащен системой хранения данных DDN ES400NVX2, сочетающей в себе архитектуру DDN Storage Fusion Architecture (SFA) и параллельную файловую систему Lustre EXAScaler. При емкости 42,2 ПБ она обеспечивает пропускную способность более 90 ГБ/с при последовательном чтении и 65 ГБ/с при последовательной записи, а также до 3 миллионов IOPS.
Согласно последнему списку суперкомпьютеров TOP500, система NEC заняла бы примерно 23-е место, если бы работала сегодня. Машина номер один, Frontier Национальной лаборатории Оук-Ридж, имеет теоретическую пиковую производительность 1,68 эксафлопса — в ней используют комбинацию процессоров AMD EPYC 64C и графических процессоров AMD Instinct MI250X.
Почему Intel Xeon 6900P и AMD Instinct MI300A
Два центральных компонента нового суперкомпьютера — процессоры Intel Xeon 6900P и AMD Instinct MI300A.
Intel Xeon 6900P. Это новая линейка серверных процессоров, разработанная для высоконагруженных и ресурсоемких сред, таких как кластеры искусственного интеллекта. Intel планирует выпускать пять вариантов процессора разного уровня мощности.
Вот основные характеристики этой линейки:
-
Оперативная память. Поддержка DDR5 с частотой до 6400 МТ/с и MRDIMM — до 8800 МТ/с.
-
Мощность и производительность. Внутри до 128 ядер и 256 потоков на базовой частоте до 2 ГГц.
-
Кеш и линии связи. Объем кеш-памяти L3 достигает 504 МБ, а количество линий PCIe 5.0/CXL 2.0 — до 96.
-
Технология Advanced Matrix Extensions. AMX ускоряет рабочие нагрузки, связанные с матричными операциями, — актуально для задач искусственного интеллекта и машинного обучения.
-
Технология Advanced Vector Extensions. AVX увеличивает скорость обработки больших данных и сложных математических вычислений, — полезно для инженерных приложений и анализа данных.
Главный недостаток процессоров Intel Xeon 6900P — значительное энергопотребление. Высокая мощность TDP до 500 Вт требует особых условий охлаждения и питания.
В новом суперкомпьютере будет стоять система жидкостного охлаждения, разработанная Giga Computing, — она обеспечивает прямой контакт между теплогенерирующими компонентами, такими как CPU или GPU, и холодной пластиной, соединенной трубками с охлаждающей жидкостью внутри.
Основатель сайта Phoronix и специалист по программному обеспечению Майкл Ларабел протестировал флагманский Xeon 6980P и ряд других процессоров, среди которых были главные конкуренты новой линейки — процессоры AMD EPYC. Вот как выглядит среднее геометрическое всех тестов производительности:
Xeon 6980P значительно опережает флагманскую модель AMD EPYC 9684X Genoa-X, а также процессоры EPYC 9754 Bergamo.
До анонса AMD EPYC пятого поколения, о котором мы рассказывали в своем обзоре, Intel Xeon 6900P выглядел лучшим решением на рынке. Новые тесты показали, что EPYC 9755 на 40% быстрее, чем Xeon 6980P с модулями MRDIMM:
Рекомендуемая розничная цена процессора EPYC 9755 — 12 984 $, в то время как цена Xeon 6980P — 17 800 $. То есть Xeon 6980 выходит дороже, чем его более быстрый конкурент. Почему NEC выбрала Xeon 6980P для своего суперкомпьютера — остается только гадать.
AMD Instinct MI300A. Это высокопроизводительный вычислительный ускоритель, разработанный AMD для использования в задачах искусственного интеллекта, машинного обучения и высокопроизводительных вычислений.
Вот основные характеристики ускорителя AMD:
-
Мощность и производительность. Внутри 24 ядра на базе архитектуры Zen 4 и 6 XCD с 228 вычислительными блоками.
-
Вычислительная архитектура. MI300A использует архитектуру CDNA 3, которая оптимизирована для центров обработки данных и суперкомпьютеров.
-
Высокопропускная память. 128 ГБ памяти HBM3 с пропускной способностью 5,3 ТБ/с.
-
Программные технологии. Открытый программный стек ROCm 6 включает модели программирования, компиляторы и библиотеки, которые улучшают работу ускорителя вычислений.
Если сравнивать с ближайшим конкурентом, NVIDIA H100, то AMD говорит о 1,8-кратном преимуществе MI300A в производительности FP64 Matrix / DGEMM и FP64 / FP32 Vector TFLOPS. А по производительности TF32, FP16, BF16, FP8 и INT8 графические ускорители NVIDIA H100 и AMD MI300A находятся примерно на одном уровне.
В России самые мощные суперкомпьютеры и вовсе работают на графических процессорах предыдущего поколения — NVIDIA A100. Суммарная мощность лучшего из них, «Червоненкиса», принадлежащего компании «Яндекс», — 21,5 петафлопса, то есть он в два раза уступает будущему японскому суперкомпьютеру.
Для чего создают новый суперкомпьютер
Систему будут использовать для исследований и разработок в области термоядерного синтеза, а также для прогнозирования экспериментов и создания сценариев работы в рамках трех проектов:
-
ИТЭР (Международный экспериментальный термоядерный реактор). Проект международного экспериментального термоядерного реактора типа токамак.
-
JT-60SA. Установка, которая создавалась для помощи в отработке термоядерных технологий международному проекту ИТЭР.
-
DEMO. Проект по созданию первой в мире термоядерной электростанции, способной производить электроэнергию в промышленных масштабах.
Институт, для которого создают суперкомпьютер, входит в Национальный институт термоядерной науки (NIFS). Суперкомпьютер предназначен для численного моделирования многомасштабных и многофизических систем, включая термоядерную плазму. NIFS будет предоставлять университетам и исследовательским институтам по всей Японии возможности для совместных исследований. Новый суперкомпьютер должен начать работу с июля 2025 года.
В России тоже планируется появление новых суперкомпьютеров — их суммарная мощность должна увеличиться в 10 раз до 2030 года. Как думаете, получится?