Microsoft разработала ультралегкую 1-битную ИИ-модель, работающую на стандартных процессорах и требующую минимум памяти

Microsoft представила BitNet b1.58 2B4T — невероятно легкую 1-битную модель ИИ, состоящую из 2 миллиардов параметров. Эта модель, доступная на платформе Hugging Face и распространяемая под лицензией MIT, может эффективно функционировать на стандартных процессорах. 

Microsoft разработала ультралегкую 1-битную ИИ-модель, работающую на стандартных процессорах и требующую минимум памяти
Изображение создано генерирующей системой Kandinsky

Главное преимущество BitNet заключается в ее использовании 1-битных весов (-1, 0, +1), что значительно уменьшает потребность в памяти и вычислительных ресурсах, если сравнить ее с традиционными 16/32-битными моделями. Пройдя обучение на 4 триллионах токенов, BitNet достигает производительности, сопоставимой с Google Gemma 3 1B, при этом используя всего лишь 400 МБ памяти. 

BitNet b1.58 2B4T пригодна для использования на устройствах с ограниченными техническими возможностями, без необходимости в мощном графическом или нейронном процессорах.

 

Источник: iXBT

Читайте также