GigaChat от Сбера теперь может распознавать изображения, рукописный текст, формулы, графики и таблицы

Команда СберБанка сообщила о внедрении инновационной функции в генеративной нейросети GigaChat. Новая версия системы искусственного интеллекта GigaChat Pro теперь позволяет работать с изображениями как с дополнительным источником данных и обрабатывает объем информации, в четыре раза превышающий предыдущие возможности.


GigaChat от Сбера теперь может распознавать изображения, рукописный текст, формулы, графики и таблицы
Сгенерировано нейросетью Dall-E

Теперь пользователи могут предоставлять изображения в качестве запросов, чтобы модель использовала их для расширенного контекста. Нейросеть способна анализировать количество людей на фотографии, их одежду и давать рекомендации по стилю, а также выполнять другие задачи.

Кроме того, модернизированная модель научилась распознавать и анализировать как печатный, так и рукописный текст, включая формулы, графики и таблицы. Это особенно полезно для студентов, которые могут сфотографировать фрагмент учебника или конспектов, загрузить изображение и быстро получить сводку текста, основные темы и план дальнейшей работы с ним.

Модель GigaChat Pro доступна бесплатно для всех желающих через веб-версию, Telegram и «ВКонтакте». Для разработчиков и бизнеса предложены решения через GigaChat API.

 

Источник: iXBT

Читайте также