Майский дайджест «железа»: тесты B300, графические процессоры Alibaba и PCIe 8.0

На связи Сергей Ковалёв из Selectel с традиционным ежемесячным обзором «железных» новинок. В этот раз я решил немного изменить подачу: первая часть статьи объединяет ключевые анонсы, которые мы уже освещали в нашем блоге в течение мая, а во второй я собрал свежие события, не попавшие в ленту ранее. Подробности — ниже.

Майский дайджест Selectel: что обсуждали

AMD Instinct MI430X

AMD представила MI430X — специализированный HPC-ускоритель, оснащенный 432 ГБ памяти HBM4 с пропускной способностью 19,6 ТБ/с и нативной производительностью FP64 более 200 TFLOPs. Это решение предназначено для сложных научных вычислений (гидродинамика, молекулярное моделирование, ядерная физика), где точность FP32 недостаточна. В отличие от эмуляции FP64 на тензорных ядрах NVIDIA, которая выдает лишь около 33 TFLOPs, решение AMD обеспечивает полноценную вычислительную мощность. Детали в нашем обзоре.

AMD Instinct MI350P

AMD выпустила карту Instinct™ MI350P в формате PCIe — первый релиз серии с 2022 года. Устройство несет на борту 144 ГБ HBM3E и базируется на архитектуре CDNA™ 4. При TDP 600 Вт карта фактически представляет собой половинную версию MI350X (четыре XCD-кристалла). Это прямой конкурент NVIDIA H200 NVL, однако отсутствие поддержки NVLink® ограничивает возможности по созданию крупных пулов. Полный разбор доступен здесь.

Тестирование NVIDIA HGX B300 в инференсе

Важный кейс для майского дайджеста: мы протестировали HGX™ B300 с 2,3 ТБ VRAM на популярных моделях, включая DeepSeek R1/V3.2, Qwen 3.5 397B и Minimax M2.5 через vLLM. Использование формата NVFP4 дает двукратный, а местами и трехкратный прирост скорости на этапе prefill. На decode-стадии разрыв менее заметен, но эффективность все равно впечатляет: Qwen 3.5 выдает до 330 тысяч ответов ежедневно. Читайте подробности в нашей статье.

Alibaba Zhenwu M890

Alibaba анонсировала GPU Zhenwu™ M890, поддерживающий инференс в FP4 и оснащенный 144 ГБ HBM. Главная особенность — суперсервер Panjiu® AL128, состоящий из 128 ускорителей с межузловой задержкой менее 150 нс. По плотности памяти решение сопоставимо с H200, однако основная ценность здесь кроется в экосистеме и ориентации на специфические рыночные запросы. Обзор устройства — по ссылке.

Majestic Labs Prometheus

Стартап Majestic Labs анонсировал платформу Prometheus на базе чипов Ignite (Arm + RISC-V). Заявленная особенность — единое адресное пространство до 128 ТБ на весь сервер, что в 60 раз больше стандартной конфигурации HGX с восемью B300. На текущий момент проект существует на уровне анонса без публичных тестов и цен, а вопрос реальной пропускной способности этой огромной памяти остается открытым. Подробнее — в заметке.

Dell PowerEdge R7725xd и Kioxia LC9

Dell и Kioxia представили сервер 2U с рекордной емкостью 9,8 ПБ, использующий 40 накопителей Kioxia LC9 в формате E3.L. Эти SSD на базе BiCS8 3D QLC NAND обеспечивают до 12 ГБ/с на последовательном чтении и 1,3 млн IOPS. Подобное решение позволяет консолидировать данные, для которых ранее потребовалось бы семь дополнительных серверов и почти три сотни дисков меньшего объема. Подробности в статье.

SSD Huawei на 122 ТБ

Huawei представила SSD объемом 122,88 ТБ, реализовав технологию DoB (Density-on-Board) для обхода ограничений на поставку 3D NAND. Отказ от традиционной корпусировки чипов в пользу распайки прямо на плату позволил повысить плотность размещения на 33%. В сочетании с накопителями YMTC это дает рекордные 4,42 ПБ в 2U-корпусе СХД OceanStor Pacific 9926. Читайте здесь.

Micron 6600 ION на 245 ТБ

Micron начала поставки SSD 6600 ION емкостью 245,76 ТБ на базе 276-слойной G9 QLC NAND (PCIe Gen5). Это один из самых объемных накопителей на рынке с высокой скоростью чтения — до 13,7 ГБ/с. Стоимость пока не раскрывается, но, судя по ценам на 122-терабайтные аналоги, цена терабайта здесь существенно выше, чем у HDD. Больше информации — в нашей публикации.

Коммутаторы Celestica DS6000

Celestica выпустила коммутаторы DS6000 на чипах Broadcom Tomahawk 6, обеспечивающие пропускную способность 102,4 Тбит/с через 64 порта по 1,6 Тбит/с каждый. Доступны версии с воздушным и гибридным жидкостным охлаждением (последнее необходимо при энергопотреблении до 6 кВт). Решение ориентировано на мощные ИИ-кластеры. Подробности — в статье.

Что еще подготовили вендоры

Dell PowerEdge XE9785: AMD EPYC 9005 и MI355X в связке

Сервер Dell PowerEdge XE9785. Источник.
Сервер Dell PowerEdge XE9785. Источник.

Dell представила PowerEdge™ XE9785 — двухпроцессорный сервер 10U на платформе AMD, ориентированный на работу с ИИ.

Ключевые характеристики:

  • CPU: до двух процессоров AMD EPYC™ 9005 (Turin), суммарно до 384 ядер;

  • RAM: 24 модуля DDR5-6400 (до 6 ТБ);

  • Накопители: 16 слотов NVMe E3.S (PCIe 5.0) либо 10 слотов U.2;

  • Ускорители: 8x AMD Instinct™ MI355X (288 ГБ HBM3E каждый);

  • Альтернатива: возможна установка 8x NVIDIA HGX™ B300;

  • Питание: 12 блоков по 3200 Вт с поддержкой горячей замены;

  • Охлаждение: воздушное, реализованное через 20 вентиляторов с возможностью горячей замены.

Использование воздушного охлаждения для такой системы — крайне смелый подход, избавляющий, однако, от необходимости развертывать СЖО в ЦОД. Dell также подтвердила совместимость с AMD Instinct MI350P для моделей XE7745 и R7725, что расширяет возможности выбора для бизнеса.

Giga Computing TO46-SD3-LA07: жидкостное охлаждение для B300

Сервер TO46-SD3-LA07. Источник.
Сервер TO46-SD3-LA07. Источник.

Компания Giga Computing выпустила OCP-сервер TO46-SD3-LA07 на базе платформы NVIDIA HGX B300.

Основные параметры:

  • CPU: пара Intel® Xeon® 6 (Granite Rapids-SP);

  • RAM: 32 слота DDR5 (RDIMM/MRDIMM);

  • GPU: 8x NVIDIA B300;

  • Сетевые возможности: поддержка 8x OSFP InfiniBand® XDR (до 800 Гбит/с);

  • Охлаждение: прямое жидкостное (Direct Liquid Cooling) для CPU и GPU с интегрированными датчиками протечки.

Система соответствует стандартам OCP, что обеспечивает вендорскую независимость. Жидкостное охлаждение в данном случае является преимуществом, учитывая тепловыделение B300.

Высокопроизводительные серверы Selectel

Серверы на базе новейших процессоров Intel® Xeon® 6, с поддержкой до 8 ТБ RAM и кастомными материнскими платами. Доступны для аренды или поставки в вашу инфраструктуру.

Узнать больше →

HPE Compute Scale-up Server 3250: до 64 ТБ памяти

HPE Compute Scale-up Server 3250. Источник.
HPE Compute Scale-up Server 3250. Источник.

HPE представила сервер Scale-up 3250, спроектированный для задач с критическими требованиями к объему RAM (SAP, крупные базы данных, OLAP).

Технические характеристики (одно шасси 5U):

  • CPU: 4x Intel® Xeon® 6700P;

  • RAM: 64 слота DDR5 (до 16 ТБ на шасси);

  • Масштабирование: объединение до 4 шасси в систему с суммарно 64 ТБ RAM;

  • Хранение: до 24 накопителей E3.S NVMe.

Это первая система такого класса на базе Xeon 6, получившая сертификацию для высоконагруженных задач SAP.

Firefly CSC2-N48SPK3: 48 узлов RISC-V

Сервер Firefly CSC2-N48SPK3. Источник.
Сервер Firefly CSC2-N48SPK3. Источник.

Компания Firefly представила сервер CSC2-N48SPK3, объединяющий 48 узлов на базе архитектуры RISC-V. Его общая производительность составляет до 2880 TOPS (INT4).

Особенности платформы:

  • 48 узлов, каждый из которых оснащен процессором SpacemiT™ Key Stone K3 (8 ядер RISC-V);

  • RAM: 8/16/32 ГБ LPDDR5 на узел;

  • Сетевой контроллер на базе Rockchip® RK3588;

  • Масштабируемость хранилища: до 48 накопителей M.2 2280 NVMe.

Проект наглядно демонстрирует применимость архитектуры RISC-V в сегменте облачной отладки и тестирования ПО, хотя для промышленной эксплуатации система пока остается экспериментальной.

Инновации в охлаждении: медные водоблоки от UIUC

Медный радиатор охлаждения. Источник.
Медный радиатор охлаждения. Источник.

Исследователи из Иллинойского университета (UIUC) в партнерстве с Fabric8Labs разработали продвинутые водоблоки для дата-центров. Вместо дешевых алюминиевых сплавов была выбрана чистая медь и 3D-печать методом ECAM™.

Результаты оптимизации:

  • Сложная геометрия ребер (зазубренные края), спроектированная топологическим алгоритмом;

  • Повышение эффективности теплоотвода на 32% в сравнении с традиционными решениями;

  • Снижение энергопотребления системы охлаждения до 1,1% от общих затрат ЦОД.

PCIe 8.0: курс на 256 ГТ/с

Сравнительная таблица скоростей PCI Express (PCIe) разных поколений. Источник.
Сравнительная таблица скоростей PCI Express (PCIe) разных поколений. Источник.

PCI-SIG опубликовала спецификацию PCIe 8.0 версии 0.5. Финализация стандарта ожидается к 2028 году.

Ключевые ориентиры:

  • Скорость передачи до 256 ГТ/с;

  • Пропускная способность до 1 ТБ/с для интерфейса x16;

  • Обратная совместимость со всеми предыдущими версиями;

  • Улучшенные алгоритмы энергоэффективности.

Учитывая стремительный рост аппетитов современных ИИ-систем, такой запас по пропускной способности выглядит необходимым заделом на будущее.

 

Источник

Читайте также