AI на железе: что выбрать — x86, ARM или RISC-V? Обзор новинок за март

Вы не ослышались: мартовские релизы ведущих вендоров охватили практически все ключевые архитектурные направления. Объединяет их одно — тотальная ориентация на запросы сферы искусственного интеллекта и машинного обучения.

Привет, SE7EN! На связи Сергей Ковалёв, менеджер выделенных серверов в Selectel. В свежем обзоре я собрал самые интересные новинки марта: от процессоров и GPU до систем хранения данных. Все подробности — далее по тексту!

Процессоры

Intel Core Ultra 200S Plus — точечная модернизация

Intel представила обновленные линейки Core Ultra 200S (десктопы) и 200HX Plus (ноутбуки). Глобальных перемен не случилось: серия представляет собой косметический рефреш архитектуры Arrow Lake. Среди улучшений — возросшее количество E-ядер, повышенные тактовые частоты и оптимизированная работа с оперативной памятью DDR5.

Модель

Ядра

Потоки

Частота P-ядер (база)

Частота E-ядер (база)

Intel Core Ultra 7 270K Plus

8P + 16E

24

3,7 ГГц

3,2 ГГц

Intel Core Ultra 5 250K Plus

6P + 12E

18

4,2 ГГц

3,3 ГГц

Стоит ли переходить на эти процессоры пользователям предыдущего поколения — большой вопрос. Детальный технический анализ и сравнение производительности с решениями AMD можно найти в полной статье.

AMD Ryzen 9 9950X3D2 Dual Edition

Компания AMD анонсировала Ryzen 9 9950X3D2 Dual Edition — дебютный потребительский CPU, оснащенный двумя кристаллами 3D V-Cache.

Ключевые спецификации:

  • Архитектура: Zen 5.

  • Конфигурация ядер/потоков: 16/32.

  • Общий объем кеш-памяти: 208 МБ.

  • Частотный диапазон: от 4,3 ГГц до 5,6 ГГц.

  • TDP: 200 Вт.

Новинка демонстрирует заметное ускорение в профессиональном софте. В рендеринге (Blender, V-Ray) прирост достигает 7%, а в задачах компиляции кода — 5–8%. Рекордный показатель в 13% зафиксирован в тестах SPEC Workstation, что говорит о серьезной оптимизации архитектуры под сложные вычисления. AMD явно метит в сегмент рабочих станций, составляя конкуренцию Intel Xeon-W. Мы внимательно следим за развитием этой технологии и рассматриваем возможность интеграции таких решений в нашу инфраструктуру.

Аукцион выделенных серверов

Успейте арендовать оборудование со скидкой до 35% до того, как его выберет кто-то другой.

Перейти к выбору →

Arm AGI: специализированные процессоры для ИИ-дата-центров

Компания Arm выпустила AGI — серверные чипы, спроектированные для работы с агентными ИИ-системами.

Архитектурный подход здесь радикален: минимум лишнего, максимум производительности. Поддержка SMT исключена в угоду предсказуемому масштабированию. Память и I/O-узлы интегрированы напрямую в кристалл для минимизации латентности. Платформа поддерживает 12 каналов DDR5 и обеспечивает мощную работу с PCIe Gen6 (96 линий) и протоколом CXL 3.0.

Линейка AGI SP113012 представлена тремя решениями (TDP 300 Вт):

  • 136C: флагман со 136 ядрами Neoverse V3 для максимально параллельных вычислений.

  • 128C: баланс производительности и совокупной стоимости владения (TCO).

  • 64C: спецрешение для задач, требовательных к пропускной способности памяти, — например, для инференса LLM.

Выход Arm на рынок готовых процессоров — серьезный сигнал для индустрии, особенно для таких компаний, как Ampere. Первыми заказчиками чипов стали технологические гиганты вроде OpenAI, SAP и Cerebras.

Что вы думаете о выходе Arm в сегмент производителей серверного «железа»? Давайте обсудим в комментариях!

Alibaba XuanTie C950 — новый лидер RISC-V

Alibaba анонсировала C950, претендующий на звание самого быстрого RISC-V процессора в мире. Ключевое отличие — аппаратная поддержка ускорения инференса языковых моделей прямо на уровне набора инструкций.

Характеристики:

  • 64-битная архитектура RISC-V, 8 декодируемых инструкций за такт.

  • Производительность 22 SPECint2006/ГГц (трехкратный рост относительно C920).

  • Векторные 256-битные регистры, поддержка форматов данных от INT8 до FP64.

Alibaba все активнее развивает собственную экосистему, и C950 — мощный инструмент для облачной инфраструктуры (работа с БД, Nginx, инференс Qwen и DeepSeek). Хотя пока чипы используются только в ЦОДах самой Alibaba, это весомый вызов для доминирующих игроков рынка.

CIX ClawCore: тройка процессоров на базе Armv9.2

Компания CIX Technology представила семейство ClawCore:

  • ClawCore-P: мультимедийный флагман (45 TOPS, 64 ГБ LPDDR5).

  • ClawCore-A: решение для непрерывного ИИ-инференса (80–200 TOPS).

  • ClawCore-E: ультраэффективный чип для IoT.

Платформа создана для работы с экосистемой OpenClaw и поддерживает множество ОС. Цель разработчиков — снизить стоимость генерации токенов вдвое за счет гибридной архитектуры: большая часть запросов обрабатывается локально, остальное — в облаке.

GPU

NVIDIA Groq 3 LPU

В рамках развития платформы Vera Rubin NVIDIA расширила возможности инфраструктуры, добавив специализированные LPU-ускорители Groq 3. В отличие от традиционных GPU, использующих внешнюю память, чип построен на сверхбыстрой встроенной SRAM. Это решение радикально снижает задержки при генерации текста и пропускную способность инференса (прирост до 35 раз на мегаватт).

NVIDIA RTX Pro 4500 Blackwell Server Edition

Серверная карта с 32 ГБ быстрой памяти GDDR7 (800 ГБ/с), оптимизированная для инференса компактных моделей. Однослотовый дизайн и пассивное охлаждение позволяют легко масштабировать вычислительные мощности. Все подробности — в нашем блоге.

Huawei Atlas 350

Huawei представила Atlas 350 на базе Ascend 950PR. Устройство оснащено 128 ГБ памяти HBM с пропускной способностью 1,6 ТБ/с. Детальное сравнение производительности с NVIDIA — в этом материале.

Диски

Kioxia GP: SSD с прямым доступом к GPU

Kioxia презентовала серию накопителей, которые GPU может использовать как расширение HBM, обходя центральный процессор. Благодаря использованию XL-Flash и интерфейса PCIe 6.0, производительность достигает миллионов IOPS. Это часть инициативы NVIDIA по оптимизации хранения данных для ИИ.

Micron 9650: первый SSD на PCIe 6.0

Micron запустила серийное производство 9650 — первого в мире SSD с поддержкой PCIe 6.0. Скорость чтения до 28 000 МБ/с и более 5 млн IOPS при чтении — это вдвое быстрее лучших накопителей прошлого поколения при сохранении энергопотребления на уровне 25 Вт. Для серверной инфраструктуры ИИ это важный шаг по устранению «узкого горлышка» в обмене данными.

Toshiba M12: 34 ТБ и стеклянные пластины

Toshiba начала поставки жестких дисков серии M12 емкостью до 34 ТБ. Инженерам удалось упаковать 11 пластин в стандартный корпус, заменив алюминий на стекло. Технология FC-MAMR и host-managed SMR позволили добиться скорости до 282 МБ/с, что делает эту модель крайне привлекательной для гиперскейлеров.

Охлаждение

Coherent Thermadite 800: алмазный водоблок

Coherent представила охлаждающие пластины из композита карбида кремния с алмазными добавками. Теплопроводность материала вдвое выше медных аналогов (800 Вт/м·К против 400). Благодаря кастомной микроканальной архитектуре, такой водоблок снижает температуру чипов более чем на 15°C.

ZutaCore OmniTherm: двухфазное охлаждение без воды

ZutaCore выпустила водоблок для NVIDIA RTX Pro 6000, использующий диэлектрическую жидкость. Она кипит прямо на поверхности чипа, превращаясь в пар и отводя тепло, а затем конденсируется. Никакой воды в системе нет — это позволяет кратно повысить плотность монтажа серверов. В Selectel мы используем эти мощные GPU с воздушным охлаждением, но подобные инновации открывают новые перспективы для проектирования ЦОД.

Какие из новинок впечатлили вас больше всего? Делитесь мнением в комментариях!

 

Источник

Читайте также