Фотоника в LLM-инференсе: обзор передовых технологий апреля

2 часа назад

Majestic Labs Prometheus, накопители Kingston DC3000ME емкостью 30,72 ТБ, TPU восьмого поколения от Google… ИТ-гиганты и инновационные компании не сбавляют темп, активно участвуя в глобальной «ИИ-гонке». Примечательно, что такая конкуренция нередко стимулирует появление на рынке по-настоящему смелых и нетривиальных инженерных решений.

Привет, SE7EN! Меня зовут Сергей Ковалёв, я отвечаю за направление выделенных серверов в Selectel. В свежем дайджесте я собрал самые интересные и значимые новинки из мира высокопроизводительного железа. Устраивайтесь поудобнее, читайте и делитесь своими мыслями в комментариях — добро пожаловать под кат!

Серверные платформы

Majestic Labs Prometheus: 128 ТБ оперативной памяти в одном узле

Фотоника в LLM-инференсе: обзор передовых технологий апреля — *Логотип на корпусе AI-сервера Majestic Labs Prometheus.* *Источник*.

Одной из главных проблем при инференсе масштабных моделей является простой графических ускорителей, ожидающих обмена данными с памятью. Чем массивнее архитектура нейросети, тем заметнее деградация производительности. Стартап Majestic Labs представил серверную платформу Prometheus, использующую фирменные ИИ-чипы Ignite (AIU). Ключевая особенность решения — внушительный объем памяти, призванный минимизировать задержки. Детальный разбор характеристик и перспектив платформы уже опубликован в Академии Selectel.

Однако открытым остается важный вопрос: какова фактическая пропускная способность этих 128 ТБ? Если она сопоставима с показателями стандартной DDR5, то Prometheus может уступить HBM-решениям. С нетерпением ждем независимых тестов.

Lumai Iris: фотонные вычисления для LLM-инференса

Серверные стойки оптической вычислительной платформы Lumai. Источник. — *Серверные стойки оптической вычислительной платформы Lumai.* *Источник*.

Британская компания Lumai, выходцы из Оксфордского университета, анонсировала линейку серверов Iris (модели Nova, Aura и Tetra), ориентированных на выполнение инференса LLM с помощью оптических вычислений.

Использование трехмерной фотоники позволяет обойти ограничения классической кремниевой архитектуры за счет массового пространственного параллелизма: система способна обрабатывать миллионы световых каналов одновременно внутри объемной структуры.

Разработчики утверждают, что такой подход обеспечивает кратное увеличение эффективности при матричных вычислениях, лежащих в основе работы трансформеров.

Ключевые особенности

Гибридная компоновка: фотоника для тензорных операций + традиционная «цифра» для управления.
Совместимость: поддержка моделей класса Llama 8B и Llama 70B (для версии Iris Nova).
Энергоэффективность: заявлено снижение потребления до 90% в сравнении с GPU.
Дезагрегированный инференс: ускоренная обработка на этапе prefill.

На текущий момент Iris Nova доступна для тестирования гиперскейлерами; детальные спецификации и цены пока остаются закрытыми. Мы продолжаем следить за развитием проекта.

Оптическая вычислительная ИИ-платформа Lumai Iris Nova. Источник. — *Оптическая вычислительная ИИ-платформа Lumai Iris Nova.* *Источник*.

Теоретический потенциал фотоники — колоссальный параллелизм при минимальном нагреве. Однако реальных независимых тестов пока нет. Доступность для узкого круга партнеров вскоре покажет: технологический ли это прорыв или исключительно удачный маркетинговый кейс для привлечения инвестиций.

Главный вызов оптических систем — точность. Аналоговая природа вычислений затрудняет работу с высокой разрядностью. И если для INT8 или FP16 это допустимо, то методы борьбы с накопленными погрешностями в длинных вычислительных цепочках компания пока не раскрывает.

Компактные серверы Supermicro на базе AMD EPYC 4005

Компактный сервер начального уровня Supermicro AS-1116R-FN4. Источник. — *Компактный сервер начального уровня Supermicro AS-1116R-FN4.* *Источник*.

Компания Supermicro представила три энергоэффективных компактных сервера, работающих на базе новейших процессоров AMD EPYC 4005 Grado.

Технические параметры

Процессор: EPYC 4005/4004 (Socket AM5, TDP до 65 Вт).
ОЗУ: 4 разъема DDR5-5600, объем до 192 ГБ.
Дисковая подсистема: 1-2 × SFF SATA, плюс пара M.2 (2280 и 22110) с поддержкой PCIe 5.0 x4.
Интерфейс расширения: PCIe 5.0 x16.

В серию вошли модели AS-E300-14GR (mini-1U), AS-1116R-FN4 (1U малой глубины) и башенный вариант AS-3015TR-i4. Последний примечателен возможностью установки двухслотовых GPU без внешнего питания, что делает его пригодным для инференса ИИ базового уровня, например, в задачах распознавания голоса.

Хотя башенные системы менее эффективны для плотной установки в ЦОД, для задач периферийных вычислений (Edge) и инфраструктурных нужд начального уровня — это отличное решение.

Динамическое снижение цен на выделенные серверы

Успейте арендовать оборудование с выгодой до 35% в рамках нашего аукциона, пока лоты не разобрали.

Подробнее →

GPU

TPU восьмого поколения: ответ Google

Новые ИИ-ускорители Google TPU 8-го поколения. Источник. — *Новые ИИ-ускорители Google TPU 8-го поколения.* *Источник*.

В рамках мероприятия Google Cloud Next была представлена восьмая генерация TPU, включающая сразу две архитектуры. Это официально закрепило тренд, о котором эксперты говорили давно: эпоха «универсальных GPU» уходит в прошлое. Детали новинок уже разобрали в Академии Selectel.

Bolt Graphics Zeus: первый этап пройден

Компания Bolt Graphics отчиталась об успешном завершении проектирования тестового кристалла Zeus, который будет произведен на мощностях TSMC. Основатель компании, ранее специализировавшийся на облачной инфраструктуре и ЦОД, сменил вектор деятельности на разработку специализированных GPU для задач рендеринга.

Архитектура печатной платы графического процессора Bolt Graphics Zeus. Источник. — *Архитектура печатной платы графического процессора Bolt Graphics Zeus.* *Источник*.

Подробности архитектуры прототипа Zeus вы можете узнать из нашего отдельного материала.

Zeus позиционируется как специализированный инструмент для трассировки лучей и профессионального рендеринга (студии VFX, рендер-фермы, HPC-моделирование). Это осознанная стратегия: не пытаться конкурировать с NVIDIA в инференсе, где барьер в виде развитой программной экосистемы практически непреодолим.

Диски

Micron 6600 ION: рекордные 245 ТБ в одном накопителе

*Серверные твердотельные накопители Micron 6600 ION.*

Готовятся поставки NVMe-накопителей емкостью 245 ТБ. Линейка 6600 ION построена на унифицированной аппаратной платформе.

Интерфейс: PCIe Gen5.
Тип памяти: 276-слойная NAND G9 QLC.
Форм-факторы: E3.L и U.2.
Также предусмотрена версия E3.S объемом до 122 ТБ.

Спецификации модели на 245,76 ТБ:

Скорость чтения: 13,7 ГБ/с (последовательная).
Скорость записи: 3,0 ГБ/с (последовательная).
Производительность: 1,78 млн IOPS при случайном чтении.
Ресурс (DWPD): 1 для последовательной записи, 0,075 для случайной (4 КБ).
Энергопотребление: не более 30 Вт.

На текущий момент конкурентных решений подобного объема в широкой продаже практически нет.

Kingston DC3000ME: 30,72 ТБ на базе надежной TLC

Серверный NVMe-накопитель Kingston DC3000ME емкостью 30.72ТБ. Источник. — *Серверный NVMe-накопитель Kingston DC3000ME емкостью 30.72ТБ.* *Источник*.

На фоне колоссальных объемов QLC-дисков Micron, компания Kingston представила модель DC3000ME емкостью 30,72 ТБ. Принципиальное отличие — использование 3D eTLC NAND, что значительно увеличивает ресурс перезаписи. Это первая модель серии DC3000ME с такой емкостью (ранее предел составлял 15,36 ТБ).

Ключевые характеристики:

Форм-фактор: U.2 (15 мм).
Интерфейс: PCIe 5.0 x4.
Тип памяти: 3D eTLC.
Последовательная скорость (чтение/запись): 14 ГБ/с / 9,7 ГБ/с.
Случайное чтение: 2,6 млн IOPS (4 КБ).
Надежность: 1 DWPD в течение 5 лет (ресурс TBW — 56 064 ТБ).
MTBF: 2 млн часов.

PetaIO: ставка на PCIe 6.0 и CXL 3.0

Линейка твердотельных NVMe-накопителей компании PetaIO. Источник. — *Линейка твердотельных NVMe-накопителей компании PetaIO.* *Источник*.

Китайский производитель PetaIO анонсировал SSD нового поколения, сочетающие интерфейс PCIe 6.0 и протокол CXL 3.0. В качестве основы выступает 6-нм контроллер Titanium Himalaya собственной разработки.

Ожидаемые параметры:

Интерфейс: PCIe 6.0.
Протокол: CXL 3.0 (пул памяти до 256 ТБ).
Скорость чтения (последовательная): свыше 28 ГБ/с (вдвое выше текущих Gen5-флагманов).
Случайное чтение: до 50 млн IOPS (512 Б).
Задержка: 2,7 мкс.

Интеграция CXL 3.0 и PCIe 6.0 — крайне перспективное направление. Если заявленные характеристики подтвердятся в полевых условиях, это может стать прорывом для ИИ-инференса, где быстрый доступ к кэшированным весам критически важен. Вектор развития китайского рынка серверных накопителей становится все более очевидным.

Контроллеры

HighPoint: RAID и HBA с поддержкой PCIe 5.0

Плата расширения HighPoint Rocket 1608A NVMe Switch. Источник. — *Плата расширения HighPoint Rocket 1608A NVMe Switch.* *Источник*.

HighPoint Technologies презентовала линейки Rocket 7600A (RAID-контроллеры) и Rocket 1600 (адаптеры для SDS), использующие PCIe 5.0 x16.

Решения оптимизированы под стек Hyper-V, Proxmox, S2D, ZFS и Ceph, что прямо указывает на нацеленность компании на перехват аудитории, мигрирующей с VMware на фоне изменения ценовой политики Broadcom.

Кратко по сериям:

Rocket 7600A: RAID 0/1/10. Интересна модель 7638D с гибридной архитектурой для прямого взаимодействия GPU ↔ NVMe, что крайне актуально для ИИ-задач.
Rocket 1600: высокая пропускная способность (до 60 ГБ/с у модели 1628A) для SDS-кластеров.

Все карты выполнены в однослотовом дизайне, что удобно, но может ограничить возможности расширения на платах с дефицитом слотов x16. В целом, достойные инструменты для построения современных систем хранения данных.

Рекомендуем к прочтению:

Сколько памяти нужно для жизни: стресс-тест старого и нового железа

Гайд по сборке кастомной механической клавиатуры

Memory wall: почему это главный вызов для современных систем хранения

Сетевое оборудование

QNAP QSW-M7230-2X4F24T: коммутатор для AI-инфраструктуры

Управляемый коммутатор L3 Lite QNAP QSW-M7230-2X4F24T. Источник. — *Управляемый коммутатор L3 Lite QNAP QSW-M7230-2X4F24T.* *Источник*.

QNAP выпустила управляемый L3 Lite коммутатор для корпоративного сегмента. Ключевые порты: 2 × 100GbE, 4 × 25GbE и 24 × 10GbE. Решение обеспечивает неблокируемую пропускную способность до 540 Гбит/с и поддержку RDMA/RoCE, что делает его сбалансированным выбором для плавного перехода на высокоскоростную сеть без полной замены текущей 10G-базы.

Foxconn FII и массовое производство CPO

Foxconn Industrial Internet (FII) запустила поставки CPO-коммутаторов (Co-Packaged Optics), где оптика интегрирована непосредственно в ASIC. Массовое производство стартует в третьем квартале 2026 года.

Технология CPO позволяет устранить задержки на интерфейсе «чип–оптика», что критически важно для плотных ИИ-кластеров. Учитывая позиции FII как ключевого производителя, к 2027 году такие системы могут стать индустриальным стандартом.

Системы охлаждения

Airsys LiquidRack: «душ» для серверов

Система жидкостного охлаждения серверов Airsys LiquidRack. Источник. — *Система жидкостного охлаждения серверов Airsys LiquidRack.* *Источник*.

Airsys представила систему LiquidRack, в которой серверы находятся в вертикальных кассетах и орошаются диэлектрической жидкостью. Преимущество перед погружными системами очевидно: серверы не нужно «топить», что упрощает обслуживание — достаточно извлечь кассету без слива системы.

Система поддерживает до 80 кВт на 10U и потребляет на 80% меньше жидкости, чем традиционные иммерсионные решения, что снижает затраты на эксплуатацию.

Заключение

Апрель стал месяцем масштабных технологических экспериментов. Вендоры активно внедряют фотонику и сверхплотные накопители, адаптируясь под требования современной ИИ-индустрии.

Что вы думаете о представленных новинках? Какие из них кажутся наиболее перспективными, а какие — маркетинговой уловкой? Жду ваших мнений в комментариях!

Источник