Тайваньский разработчик Skymizer представил инновационный ускоритель для задач искусственного интеллекта — HTX301. По заявлениям компании, эта PCIe-карта позволяет развертывать масштабные языковые модели, насчитывающие до 700 миллиардов параметров. Примечательно, что вместо использования ультрасовременных техпроцессов и дорогостоящей памяти HBM, инженеры сделали выбор в пользу зрелой 28-нм архитектуры и доступной памяти стандартов LPDDR4/LPDDR5.
Стратегия Skymizer заключается в приоритизации емкости памяти и энергоэффективности, а не в погоне за пиковой вычислительной производительностью. Карта HTX301 оснащена 384 ГБ памяти, распределенной между шестью специализированными процессорами HyperThought. При этом общий уровень энергопотребления системы составляет всего 240 Вт, что значительно экономичнее решений аналогичного уровня от индустриальных гигантов вроде Nvidia или AMD.
Производитель заявляет о возможности генерации до 30 токенов в секунду для сверхкрупных LLM и до 240 токенов в секунду при работе с компактными моделями класса Llama2 7B. Столь высокие показатели достигаются благодаря проприетарным алгоритмам сжатия весов и оптимизации KV-кэша, которые, по данным Skymizer, позволяют HTX301 опережать популярный движок llama.cpp на 9–17,8%.

В компании подчеркивают, что их разработка призвана решить критическую проблему корпоративного сектора — зависимость от капиталоемких GPU-кластеров, требующих специфического охлаждения и высоких энергозатрат. HTX301 оптимизирован для интеграции в стандартные серверные стойки с воздушным охлаждением, что исключает необходимость дорогостоящей реконструкции дата-центров.
Помимо технической эффективности, Skymizer делает акцент на преимуществах локального инференса. Развертывание моделей непосредственно на мощностях предприятия позволяет минимизировать риски утечки данных, устраняет привязку к облачным провайдерам и помогает прогнозировать эксплуатационные расходы.
Заявления Skymizer выглядят весьма амбициозно на фоне текущих рыночных стандартов. Так, ускоритель AMD Instinct MI350P располагает 144 ГБ памяти HBM3E, а Nvidia RTX PRO 6000 Blackwell потребляет порядка 600 Вт. Тайваньский стартап стремится доказать, что в задачах инференса архитектура памяти и методы оптимизации моделей порой важнее «сырой» вычислительной мощности.
Тем не менее, на данный момент озвученные характеристики базируются исключительно на данных производителя. Ожидается, что независимая проверка возможностей HTX301 состоится в начале июня на выставке Computex 2026. Только реальные тесты покажут, удалось ли Skymizer создать по-настоящему доступную альтернативу решениям Nvidia и AMD, либо же проект останется лишь многообещающим концептом, не выдержавшим столкновения с практикой.
Источник: iXBT


