Яндекс улучшил поиск по архивам с помощью нейросети Alice AI VLM

Специалисты Яндекса усовершенствовали инструмент для поиска по архивным документам, интегрировав передовую нейросетевую модель Alice AI VLM. Теперь система не просто переводит рукописный текст в цифровой формат, но и проводит глубокую аналитику: классифицирует участников событий и выявляет взаимосвязи между ними. Благодаря этому пользователи могут мгновенно идентифицировать конкретных персон и существенно ускорить процесс генеалогических исследований.

Яндекс улучшил поиск по архивам с помощью нейросети Alice AI VLM
Визуализация создана при помощи Midjourney

Внедрение инновационного решения открыло возможности для детальной фильтрации данных по типам событий и социальным ролям. К примеру, при анализе свидетельств о рождении можно отсортировать записи по категориям «новорожденный», «отец» или «мать», а в актах о заключении брака — выделить «жениха», «невесту» или «свидетелей».

Источник изображения: Яндекс

Функционирование сервиса базируется на мультимодальной архитектуре Alice AI VLM, демонстрирующей исключительные способности в интерпретации как изображений, так и текстов на русском языке. Разработчики подчеркивают, что именно этот технологический прорыв позволил достичь впечатляющей точности распознавания, достигающей в пиковых значениях для записей о рождении 92,7%.

Сервис «Поиск по архивам» остается незаменимым помощником в поиске сведений о предках, локациях и ключевых исторических событиях, зафиксированных в документах XVIII–XX веков. В настоящее время база проекта насчитывает свыше 20 миллионов оцифрованных страниц из различных региональных архивов, а также внушительный массив данных из более чем двухсот дореволюционных и советских периодических изданий.

 

Источник: iXBT

Читайте также