Становятся общедоступными веса двух новых флагманских MoE‑моделей GigaChat — Ultra‑Preview и Lightning — а также следующего поколения модели GigaAM‑v3 и компоненты обновлённой линейки Kandinsky 5.0, сообщили «Коду Дурова» в пресс‑службе Сбера.
По словам компании, MoE‑модели GigaChat Ultra‑Preview и Lightning разработаны с нуля под задачи на русском языке, а семейство GigaAM‑v3 предназначено для распознавания речи с корректной расстановкой знаков препинания и нормализацией.
В линейке Kandinsky 5.0 представлены собственные решения Сбера — Video Pro, Video Lite и Image Lite. Они оптимизированы под понимание промптов на русском, учитывают особенности русской культуры и умеют корректно генерировать кириллический текст в изображениях и видео.
Кроме того, открыт общий доступ к K‑VAE 1.0 — автокодировщикам для сжатия визуальных данных, которые используются при обучении генеративных визуальных моделей. В пресс‑релизе компании эти модели названы лучшими в мире среди открытых аналогов.
Главное о моделях
- GigaChat Ultra‑Preview, по заявлению Сбера, стала самой крупной и мощной моделью в серии GigaChat и на текущем этапе опережает DeepSeek V3.1 по совокупным метрикам качества в русскоязычных задачах.
- GigaChat Lightning спроектирована как максимально компактная и быстрая MoE‑модель в линейке: её отмечают за оптимизацию под локальный запуск на ноутбуке и за пригодность для быстрых продуктовых итераций.
«По уровню качества она конкурирует с ведущими мировыми open‑source решениями в своей категории: превосходит Qwen3‑4B в задачах на русском и не уступает ей в диалоговых сценариях, анализе документов и решении прикладных бизнес‑задач».
- GigaAM‑v3 представляет собой открытый набор из пяти моделей для автоматического распознавания речи на русском языке, доступный для промышленного и коммерческого использования.
«GigaAM‑v3 ориентирован на голосовые ассистенты, контакт‑центры и анализ звонков, агрегаторы голосовых сообщений и мультимодальные агенты».
- Модели Kandinsky 5.0 дают платформу для создания широкого спектра продуктов — от инструментов для персонального творчества до профессиональных решений для индустрии.
«Разработчики и компании смогут создавать сервисы для генерации персонализованных видеопоздравлений, оживления фотографий и создания оригинальных визуальных историй».
- В пресс‑материалах указано, что обучение Kandinsky 5.0 велось почти на 1 млрд изображений и на 300 млн видеороликов.
- K‑VAE 1.0 — это собственные автокодировщики для 2D‑изображений и 3D‑видео, преобразующие медиа в компактные скрытые представления и восстанавливающие их обратно.
«K‑VAE 1.0 — лучшие из доступных в открытом доступе аналогов; их публичное использование позволит качественно продвинуть технологии генеративного ИИ».
Старший вице‑президент и руководитель блока «Технологическое развитие» Сбера Андрей Белевцев подчеркнул, что для создания ИИ мирового уровня необходимы огромные ресурсы и сильные R&D‑команды:
«У Сбера есть и то, и другое. Наша ключевая позиция — не создавать «закрытую» технологию. Мы строим открытый фундамент для страны: передавая веса моделей, любая российская компания — от банка до стартапа — сможет разместить их внутри своего периметра и дообучить на конфиденциальных данных, не раскрывая их третьим лицам».
Белевцев охарактеризовал такой подход как технологический суверенитет, когда ИИ становится доступным для всей страны и служит базой для трансформации бизнеса и стимулирования экономического роста.
«Модель Ultra вскоре будет доступна и корпоративным клиентам в версии, оптимизированной по стоимости владения для размещения внутри периметра компании».
В Сбере также отметили, что код и веса всех перечисленных моделей опубликованы под лицензией MIT и могут использоваться в том числе в коммерческих проектах.

