Сбер открыл доступ к своим ИИ-технологиям

Представители Сбербанка объявили, что в открытый доступ выложены базовые и инструктивные версии наиболее производительной модели GigaChat Lite, а также самая мощная, согласно бенчмарку ruMTEB, русскоязычная модель — GigaEmbeddings-instruct.


Сбер открыл доступ к своим ИИ-технологиям
Создано с помощью нейросети Dall-E

Кроме того, значительное обновление получила линейка моделей с открытым исходным кодом для распознавания речи и эмоций GigaAM (Giga Acoustic Model). Об этом сообщил технический директор GigaChat Фёдор Минькин на международной конференции AI Journey («Путешествие в мир искусственного интеллекта»).

В новой версии акустических моделей GigaAM произошли улучшения в подготовке данных и технологии предварительного обучения основной модели. Это привело к существенному снижению процента ошибок (Word Error Rate) в процессе распознавания русскоязычных запросов. Для самой производительной модели семейства GigaAM-RNNT данный показатель улучшился на 25% по сравнению с предыдущей версией и на 56% превышает результаты модели OpenAI-Whisper-large-v3.

Обновленная серия моделей GigaAM поддерживает дальнейшее обучение и вывод с использованием Flash Attention, что значительно ускоряет обработку на современных графических процессорах. Чтобы расширить доступность использования моделей, команда упростила код, минимизировала количество зависимостей и подготовила возможность конвертации в формат ONNX (открытая библиотека программного обеспечения). Новые модели распространяются под лицензией MIT, что допускает их коммерческое использование.

 

Источник: iXBT

Читайте также