Коллектив Сбера совершил важный прорыв. Разработчики опубликовали веса (числовые параметры, определяющие интенсивность связей) двух новых флагманских MoE-моделей семейства GigaChat — Ultra-Preview и Lightning. Обе модели изначально разрабатывались с нуля специально для задач на русском языке. Параллельно представлено новое поколение open-source моделей GigaAM-v3 для распознавания речи с автоматическим восстановлением пунктуации и нормализацией.

Дополнительно открыт доступ ко всем инструментам генерации изображений и видео из новой серии Kandinsky 5.0 — Video Pro, Video Lite и Image Lite. Эти фирменные нейросети изначально оптимизированы для обработки запросов на русском языке, учитывают особенности отечественной культуры и способны воспроизводить кириллические надписи в кадре. Также опубликованы модели сжатия визуальных данных K-VAE 1.0, необходимые для обучения систем визуальной генерации. Весь исходный код и веса перечисленных решений распространяются по лицензии MIT и могут использоваться даже в коммерческих проектах.
По словам Германа Грефа, президента и председателя правления Сбербанка:
Этот проект станет крупнейшей в Европе open-source инициативой. Мы выкладываем все модели вместе с соответствующими весами в свободный доступ.
Источник: iXBT



