Яндекс представил ИИ-ассистента для работы с научными данными на восточных языках

Специалисты Яндекса совместно с исследователями Института востоковедения РАН разработали интеллектуального ассистента, значительно ускоряющего анализ материалов на восточных языках. По словам пресс-службы, новая система способна обрабатывать до тысячи источников в сутки вместо привычных 8–10, что позволяет экспертам оперативнее обращаться к первоисточникам из стран Азии, Африки и Ближнего Востока.

Яндекс представил ИИ-ассистента для работы с научными данными на восточных языках
Сгенерировано нейросетью Midjourney

На текущем этапе тестирования инструмент доступен лишь сотрудникам Института востоковедения РАН, однако впоследствии планируется сделать его открытым для всех заинтересованных исследователей. В Яндексе подчеркнули:

В настоящее время доступ к первоисточникам по восточным регионам существенно ограничен: большинство материалов публикуется исключительно на национальных языках и крайне редко переводится. Это осложняет проведение научных и аналитических исследований и зачастую приводит к искажённым представлениям о событиях из-за англоязычной интерпретации.

Разработка выполнена на платформе Yandex AI Studio, предназначенной для создания ИИ-приложений и цифровых агентов. Система анализирует научные тексты, извлекает ключевые факты и генерирует лаконичные аналитические сводки. Обучение генеративных моделей осуществляли специалисты Yandex Cloud вместе со студентами Школы анализа данных. Кроме того, ассистент мониторит публикации в китайских СМИ и формирует русскоязычные дайджесты, что обеспечивает исследователям оперативный доступ к свежей информации о событиях в регионе.

В качестве источника знаний используется архив востоковедных материалов Института востоковедения РАН — монографии, научные статьи и иные публикации его сотрудников. Объём базы данных ассистента превышает 1,5 миллиона документов, охватывающих четыре варианта китайского языка: континентальный, тайваньский, гонконгский и сингапурский.

 

Источник: iXBT

Читайте также