Фотоника в LLM-инференсе: обзор передовых технологий апреля

Majestic Labs Prometheus, накопители Kingston DC3000ME емкостью 30,72 ТБ, TPU восьмого поколения от Google… ИТ-гиганты и инновационные компании не сбавляют темп, активно участвуя в глобальной «ИИ-гонке». Примечательно, что такая конкуренция нередко стимулирует появление на рынке по-настоящему смелых и нетривиальных инженерных решений.

Привет, SE7EN! Меня зовут Сергей Ковалёв, я отвечаю за направление выделенных серверов в Selectel. В свежем дайджесте я собрал самые интересные и значимые новинки из мира высокопроизводительного железа. Устраивайтесь поудобнее, читайте и делитесь своими мыслями в комментариях — добро пожаловать под кат!

Серверные платформы

Majestic Labs Prometheus: 128 ТБ оперативной памяти в одном узле

Фотоника в LLM-инференсе: обзор передовых технологий апреля
Логотип на корпусе AI-сервера Majestic Labs Prometheus. Источник.

Одной из главных проблем при инференсе масштабных моделей является простой графических ускорителей, ожидающих обмена данными с памятью. Чем массивнее архитектура нейросети, тем заметнее деградация производительности. Стартап Majestic Labs представил серверную платформу Prometheus, использующую фирменные ИИ-чипы Ignite (AIU). Ключевая особенность решения — внушительный объем памяти, призванный минимизировать задержки. Детальный разбор характеристик и перспектив платформы уже опубликован в Академии Selectel.

Однако открытым остается важный вопрос: какова фактическая пропускная способность этих 128 ТБ? Если она сопоставима с показателями стандартной DDR5, то Prometheus может уступить HBM-решениям. С нетерпением ждем независимых тестов.

Lumai Iris: фотонные вычисления для LLM-инференса

Серверные стойки оптической вычислительной платформы Lumai. Источник.
Серверные стойки оптической вычислительной платформы Lumai. Источник.

Британская компания Lumai, выходцы из Оксфордского университета, анонсировала линейку серверов Iris (модели Nova, Aura и Tetra), ориентированных на выполнение инференса LLM с помощью оптических вычислений.

Использование трехмерной фотоники позволяет обойти ограничения классической кремниевой архитектуры за счет массового пространственного параллелизма: система способна обрабатывать миллионы световых каналов одновременно внутри объемной структуры.

Разработчики утверждают, что такой подход обеспечивает кратное увеличение эффективности при матричных вычислениях, лежащих в основе работы трансформеров.

Ключевые особенности

  • Гибридная компоновка: фотоника для тензорных операций + традиционная «цифра» для управления.

  • Совместимость: поддержка моделей класса Llama 8B и Llama 70B (для версии Iris Nova).

  • Энергоэффективность: заявлено снижение потребления до 90% в сравнении с GPU.

  • Дезагрегированный инференс: ускоренная обработка на этапе prefill.

На текущий момент Iris Nova доступна для тестирования гиперскейлерами; детальные спецификации и цены пока остаются закрытыми. Мы продолжаем следить за развитием проекта.

Оптическая вычислительная ИИ-платформа Lumai Iris Nova. Источник.
Оптическая вычислительная ИИ-платформа Lumai Iris Nova. Источник.

Теоретический потенциал фотоники — колоссальный параллелизм при минимальном нагреве. Однако реальных независимых тестов пока нет. Доступность для узкого круга партнеров вскоре покажет: технологический ли это прорыв или исключительно удачный маркетинговый кейс для привлечения инвестиций.

Главный вызов оптических систем — точность. Аналоговая природа вычислений затрудняет работу с высокой разрядностью. И если для INT8 или FP16 это допустимо, то методы борьбы с накопленными погрешностями в длинных вычислительных цепочках компания пока не раскрывает.

Компактные серверы Supermicro на базе AMD EPYC 4005

Компактный сервер начального уровня Supermicro AS-1116R-FN4. Источник.
Компактный сервер начального уровня Supermicro AS-1116R-FN4. Источник.

Компания Supermicro представила три энергоэффективных компактных сервера, работающих на базе новейших процессоров AMD EPYC 4005 Grado.

Технические параметры

  • Процессор: EPYC 4005/4004 (Socket AM5, TDP до 65 Вт).

  • ОЗУ: 4 разъема DDR5-5600, объем до 192 ГБ.

  • Дисковая подсистема: 1-2 × SFF SATA, плюс пара M.2 (2280 и 22110) с поддержкой PCIe 5.0 x4.

  • Интерфейс расширения: PCIe 5.0 x16.

В серию вошли модели AS-E300-14GR (mini-1U), AS-1116R-FN4 (1U малой глубины) и башенный вариант AS-3015TR-i4. Последний примечателен возможностью установки двухслотовых GPU без внешнего питания, что делает его пригодным для инференса ИИ базового уровня, например, в задачах распознавания голоса.

Хотя башенные системы менее эффективны для плотной установки в ЦОД, для задач периферийных вычислений (Edge) и инфраструктурных нужд начального уровня — это отличное решение.

Динамическое снижение цен на выделенные серверы

Успейте арендовать оборудование с выгодой до 35% в рамках нашего аукциона, пока лоты не разобрали.

Подробнее →

GPU

TPU восьмого поколения: ответ Google

Новые ИИ-ускорители Google TPU 8-го поколения. Источник.
Новые ИИ-ускорители Google TPU 8-го поколения. Источник.

В рамках мероприятия Google Cloud Next была представлена восьмая генерация TPU, включающая сразу две архитектуры. Это официально закрепило тренд, о котором эксперты говорили давно: эпоха «универсальных GPU» уходит в прошлое. Детали новинок уже разобрали в Академии Selectel.

Bolt Graphics Zeus: первый этап пройден

Компания Bolt Graphics отчиталась об успешном завершении проектирования тестового кристалла Zeus, который будет произведен на мощностях TSMC. Основатель компании, ранее специализировавшийся на облачной инфраструктуре и ЦОД, сменил вектор деятельности на разработку специализированных GPU для задач рендеринга.

Архитектура печатной платы графического процессора Bolt Graphics Zeus. Источник.
Архитектура печатной платы графического процессора Bolt Graphics Zeus. Источник.

Подробности архитектуры прототипа Zeus вы можете узнать из нашего отдельного материала.

Zeus позиционируется как специализированный инструмент для трассировки лучей и профессионального рендеринга (студии VFX, рендер-фермы, HPC-моделирование). Это осознанная стратегия: не пытаться конкурировать с NVIDIA в инференсе, где барьер в виде развитой программной экосистемы практически непреодолим.

Диски

Micron 6600 ION: рекордные 245 ТБ в одном накопителе

Серверные твердотельные накопители Micron 6600 ION.
Серверные твердотельные накопители Micron 6600 ION.

Готовятся поставки NVMe-накопителей емкостью 245 ТБ. Линейка 6600 ION построена на унифицированной аппаратной платформе.

  • Интерфейс: PCIe Gen5.

  • Тип памяти: 276-слойная NAND G9 QLC.

  • Форм-факторы: E3.L и U.2.

  • Также предусмотрена версия E3.S объемом до 122 ТБ.

Спецификации модели на 245,76 ТБ:

  • Скорость чтения: 13,7 ГБ/с (последовательная).

  • Скорость записи: 3,0 ГБ/с (последовательная).

  • Производительность: 1,78 млн IOPS при случайном чтении.

  • Ресурс (DWPD): 1 для последовательной записи, 0,075 для случайной (4 КБ).

  • Энергопотребление: не более 30 Вт.

На текущий момент конкурентных решений подобного объема в широкой продаже практически нет.

Kingston DC3000ME: 30,72 ТБ на базе надежной TLC

Серверный NVMe-накопитель Kingston DC3000ME емкостью 30.72ТБ. Источник.
Серверный NVMe-накопитель Kingston DC3000ME емкостью 30.72ТБ. Источник.

На фоне колоссальных объемов QLC-дисков Micron, компания Kingston представила модель DC3000ME емкостью 30,72 ТБ. Принципиальное отличие — использование 3D eTLC NAND, что значительно увеличивает ресурс перезаписи. Это первая модель серии DC3000ME с такой емкостью (ранее предел составлял 15,36 ТБ).

Ключевые характеристики:

  • Форм-фактор: U.2 (15 мм).

  • Интерфейс: PCIe 5.0 x4.

  • Тип памяти: 3D eTLC.

  • Последовательная скорость (чтение/запись): 14 ГБ/с / 9,7 ГБ/с.

  • Случайное чтение: 2,6 млн IOPS (4 КБ).

  • Надежность: 1 DWPD в течение 5 лет (ресурс TBW — 56 064 ТБ).

  • MTBF: 2 млн часов.

PetaIO: ставка на PCIe 6.0 и CXL 3.0

Линейка твердотельных NVMe-накопителей компании PetaIO. Источник.
Линейка твердотельных NVMe-накопителей компании PetaIO. Источник.

Китайский производитель PetaIO анонсировал SSD нового поколения, сочетающие интерфейс PCIe 6.0 и протокол CXL 3.0. В качестве основы выступает 6-нм контроллер Titanium Himalaya собственной разработки.

Ожидаемые параметры:

  • Интерфейс: PCIe 6.0.

  • Протокол: CXL 3.0 (пул памяти до 256 ТБ).

  • Скорость чтения (последовательная): свыше 28 ГБ/с (вдвое выше текущих Gen5-флагманов).

  • Случайное чтение: до 50 млн IOPS (512 Б).

  • Задержка: 2,7 мкс.

Интеграция CXL 3.0 и PCIe 6.0 — крайне перспективное направление. Если заявленные характеристики подтвердятся в полевых условиях, это может стать прорывом для ИИ-инференса, где быстрый доступ к кэшированным весам критически важен. Вектор развития китайского рынка серверных накопителей становится все более очевидным.

Контроллеры

HighPoint: RAID и HBA с поддержкой PCIe 5.0

Плата расширения HighPoint Rocket 1608A NVMe Switch. Источник.
Плата расширения HighPoint Rocket 1608A NVMe Switch. Источник.

HighPoint Technologies презентовала линейки Rocket 7600A (RAID-контроллеры) и Rocket 1600 (адаптеры для SDS), использующие PCIe 5.0 x16.

Решения оптимизированы под стек Hyper-V, Proxmox, S2D, ZFS и Ceph, что прямо указывает на нацеленность компании на перехват аудитории, мигрирующей с VMware на фоне изменения ценовой политики Broadcom.

Кратко по сериям:

  • Rocket 7600A: RAID 0/1/10. Интересна модель 7638D с гибридной архитектурой для прямого взаимодействия GPU ↔ NVMe, что крайне актуально для ИИ-задач.

  • Rocket 1600: высокая пропускная способность (до 60 ГБ/с у модели 1628A) для SDS-кластеров.

Все карты выполнены в однослотовом дизайне, что удобно, но может ограничить возможности расширения на платах с дефицитом слотов x16. В целом, достойные инструменты для построения современных систем хранения данных.

Рекомендуем к прочтению:

Сетевое оборудование

QNAP QSW-M7230-2X4F24T: коммутатор для AI-инфраструктуры

Управляемый коммутатор L3 Lite QNAP QSW-M7230-2X4F24T. Источник. 
Управляемый коммутатор L3 Lite QNAP QSW-M7230-2X4F24T. Источник.

QNAP выпустила управляемый L3 Lite коммутатор для корпоративного сегмента. Ключевые порты: 2 × 100GbE, 4 × 25GbE и 24 × 10GbE. Решение обеспечивает неблокируемую пропускную способность до 540 Гбит/с и поддержку RDMA/RoCE, что делает его сбалансированным выбором для плавного перехода на высокоскоростную сеть без полной замены текущей 10G-базы.

Foxconn FII и массовое производство CPO

Foxconn Industrial Internet (FII) запустила поставки CPO-коммутаторов (Co-Packaged Optics), где оптика интегрирована непосредственно в ASIC. Массовое производство стартует в третьем квартале 2026 года.

Технология CPO позволяет устранить задержки на интерфейсе «чип–оптика», что критически важно для плотных ИИ-кластеров. Учитывая позиции FII как ключевого производителя, к 2027 году такие системы могут стать индустриальным стандартом.

Системы охлаждения

Airsys LiquidRack: «душ» для серверов

Система жидкостного охлаждения серверов Airsys LiquidRack. Источник.
Система жидкостного охлаждения серверов Airsys LiquidRack. Источник.

Airsys представила систему LiquidRack, в которой серверы находятся в вертикальных кассетах и орошаются диэлектрической жидкостью. Преимущество перед погружными системами очевидно: серверы не нужно «топить», что упрощает обслуживание — достаточно извлечь кассету без слива системы.

Система поддерживает до 80 кВт на 10U и потребляет на 80% меньше жидкости, чем традиционные иммерсионные решения, что снижает затраты на эксплуатацию.

Заключение

Апрель стал месяцем масштабных технологических экспериментов. Вендоры активно внедряют фотонику и сверхплотные накопители, адаптируясь под требования современной ИИ-индустрии.

Что вы думаете о представленных новинках? Какие из них кажутся наиболее перспективными, а какие — маркетинговой уловкой? Жду ваших мнений в комментариях!

 

Источник

Читайте также