Сотрудничество Intel и AMD: в 2025 году будет создан суперкомпьютер с производительностью 40,4 петафлопса

Привет! На связи команда mClouds. В октябре мы писали об успехах Intel: несмотря на финансовые неудачи, компания вывела на рынок новый процессор — Intel Xeon 6900P. И вот уже на основе этих процессоров IT-компания NEC собирает суперкомпьютер следующего поколения для японского Национального института квантовой науки и технологии (QST). В систему также включат ускорители AMD Instinct, чтобы достичь производительности 40,4 петафлопса.

Рассказываем, из какого железа будет состоять будущий суперкомпьютер и для какой цели его создают.

Что внутри нового суперкомпьютера

Система включает:

  • 360 компьютеров NEC LX 204Bin-3 с 720 процессорами Intel Xeon 6900P;

  • 70 компьютеров NEC LX 401Bax-3GA с 280 процессорами AMD Instinct MI300A;

  • модулей памяти MRDIMM DDR5;

  • системы жидкостного охлаждения, разработанной Giga Computing.

В сетевой среде используется InfiniBand с NVIDIA QM9700, программное обеспечение Altair PBS Professional и планировщик, оптимизированный для AMD Instinct MI300A.

Суперкомпьютер оснащен системой хранения данных DDN ES400NVX2, сочетающей в себе архитектуру DDN Storage Fusion Architecture (SFA) и параллельную файловую систему Lustre EXAScaler. При емкости 42,2 ПБ она обеспечивает пропускную способность более 90 ГБ/с при последовательном чтении и 65 ГБ/с при последовательной записи, а также до 3 миллионов IOPS.

Согласно последнему списку суперкомпьютеров TOP500, система NEC заняла бы примерно 23-е место, если бы работала сегодня. Машина номер один, Frontier Национальной лаборатории Оук-Ридж, имеет теоретическую пиковую производительность 1,68 эксафлопса — в ней используют комбинацию процессоров AMD EPYC 64C и графических процессоров AMD Instinct MI250X.

Почему Intel Xeon 6900P и AMD Instinct MI300A

Два центральных компонента нового суперкомпьютера — процессоры Intel Xeon 6900P и AMD Instinct MI300A.

Intel Xeon 6900P. Это новая линейка серверных процессоров, разработанная для высоконагруженных и ресурсоемких сред, таких как кластеры искусственного интеллекта. Intel планирует выпускать пять вариантов процессора разного уровня мощности.

Вот основные характеристики этой линейки:

  • Оперативная память. Поддержка DDR5 с частотой до 6400 МТ/с и MRDIMM — до 8800 МТ/с.

  • Мощность и производительность. Внутри до 128 ядер и 256 потоков на базовой частоте до 2 ГГц.

  • Кеш и линии связи. Объем кеш-памяти L3 достигает 504 МБ, а количество линий PCIe 5.0/CXL 2.0 — до 96.

  • Технология Advanced Matrix Extensions. AMX ускоряет рабочие нагрузки, связанные с матричными операциями, — актуально для задач искусственного интеллекта и машинного обучения.

  • Технология Advanced Vector Extensions. AVX увеличивает скорость обработки больших данных и сложных математических вычислений, — полезно для инженерных приложений и анализа данных.

Главный недостаток процессоров Intel Xeon 6900P — значительное энергопотребление. Высокая мощность TDP до 500 Вт требует особых условий охлаждения и питания.

В новом суперкомпьютере будет стоять система жидкостного охлаждения, разработанная Giga Computing, — она обеспечивает прямой контакт между теплогенерирующими компонентами, такими как CPU или GPU, и холодной пластиной, соединенной трубками с охлаждающей жидкостью внутри.

Основатель сайта Phoronix и специалист по программному обеспечению Майкл Ларабел протестировал флагманский Xeon 6980P и ряд других процессоров, среди которых были главные конкуренты новой линейки — процессоры AMD EPYC. Вот как выглядит среднее геометрическое всех тестов производительности:

Сотрудничество Intel и AMD: в 2025 году будет создан суперкомпьютер с производительностью 40,4 петафлопса

Xeon 6980P значительно опережает флагманскую модель AMD EPYC 9684X Genoa-X, а также процессоры EPYC 9754 Bergamo.

До анонса AMD EPYC пятого поколения, о котором мы рассказывали в своем обзоре, Intel Xeon 6900P выглядел лучшим решением на рынке. Новые тесты показали, что EPYC 9755 на 40% быстрее, чем Xeon 6980P с модулями MRDIMM:

Рекомендуемая розничная цена процессора EPYC 9755 — 12 984 $, в то время как цена Xeon 6980P — 17 800 $. То есть Xeon 6980 выходит дороже, чем его более быстрый конкурент. Почему NEC выбрала Xeon 6980P для своего суперкомпьютера — остается только гадать.

AMD Instinct MI300A. Это высокопроизводительный вычислительный ускоритель, разработанный AMD для использования в задачах искусственного интеллекта, машинного обучения и высокопроизводительных вычислений.

Вот основные характеристики ускорителя AMD:

  • Мощность и производительность. Внутри 24 ядра на базе архитектуры Zen 4 и 6 XCD с 228 вычислительными блоками.

  • Вычислительная архитектура. MI300A использует архитектуру CDNA 3, которая оптимизирована для центров обработки данных и суперкомпьютеров.

  • Высокопропускная память. 128 ГБ памяти HBM3 с пропускной способностью 5,3 ТБ/с.

  • Программные технологии. Открытый программный стек ROCm 6 включает модели программирования, компиляторы и библиотеки, которые улучшают работу ускорителя вычислений.

Если сравнивать с ближайшим конкурентом, NVIDIA H100, то AMD говорит о 1,8-кратном преимуществе MI300A в производительности FP64 Matrix / DGEMM и FP64 / FP32 Vector TFLOPS. А по производительности TF32, FP16, BF16, FP8 и INT8 графические ускорители NVIDIA H100 и AMD MI300A находятся примерно на одном уровне.

В России самые мощные суперкомпьютеры и вовсе работают на графических процессорах предыдущего поколения — NVIDIA A100. Суммарная мощность лучшего из них, «Червоненкиса», принадлежащего компании «Яндекс», — 21,5 петафлопса, то есть он в два раза уступает будущему японскому суперкомпьютеру.

Для чего создают новый суперкомпьютер

Систему будут использовать для исследований и разработок в области термоядерного синтеза, а также для прогнозирования экспериментов и создания сценариев работы в рамках трех проектов:

  • ИТЭР (Международный экспериментальный термоядерный реактор). Проект международного экспериментального термоядерного реактора типа токамак.

  • JT-60SA. Установка, которая создавалась для помощи в отработке термоядерных технологий международному проекту ИТЭР.

  • DEMO. Проект по созданию первой в мире термоядерной электростанции, способной производить электроэнергию в промышленных масштабах.

Институт, для которого создают суперкомпьютер, входит в Национальный институт термоядерной науки (NIFS). Суперкомпьютер предназначен для численного моделирования многомасштабных и многофизических систем, включая термоядерную плазму. NIFS будет предоставлять университетам и исследовательским институтам по всей Японии возможности для совместных исследований. Новый суперкомпьютер должен начать работу с июля 2025 года.

В России тоже планируется появление новых суперкомпьютеров — их суммарная мощность должна увеличиться в 10 раз до 2030 года. Как думаете, получится?

 

Источник

Читайте также