Yandex Data Factory (YDF), подразделение российской компании «Яндекс», начало закрытое бета-тестирование нового сервиса под названием «Экстракт».
«Экстракт» — это специализированная система поиска для бизнес-задач. Она позволяет найти все доступные страницы в какой-либо узкой области. Кроме того, сервис даёт возможность проводить регулярный мониторинг данных по интересующим темам.
В обычном поиске «Яндекса» используется общая модель релевантности, которая определяет соответствие конкретной страницы заданному запросу на основе поведения всех пользователей. «Экстракт» же позволяет пользователю «натренировать» систему искать то, что нужно именно ему в рамках конкретной бизнес-задачи. Это делается с помощью разметки: пользователь отмечает, какие страницы ему подходят, а какие — нет. По этой разметке алгоритмы машинного обучения понимают, какие результаты будут полезны для пользователя. Созданная таким образом модель ранжирует все страницы в Интернете, определяя их релевантность для бизнес-задачи конкретного пользователя.
Кроме того, пользователь может обучать и запускать поиск сразу по нескольким задачам. В каждом случае сервис формирует специализированную поисковую выдачу, а система автоматического мониторинга уведомляет о появлении новых релевантных страниц.
Предполагается, что новый сервис пригодится прежде всего тем, кто занимается исследованиями, поиском и мониторингом специализированной информации в Сети. Это могут быть аналитики различных компаний, сотрудники исследовательских или консалтинговых организаций. Спектр возможных задач очень широк: от сбора информации об организациях или мониторинга упоминаний об определённых событиях до поиска научных исследований.
Доступ к системе будет предоставляться на платной основе. Стоимость использования сервиса «Экстракт» будет обсуждаться индивидуально с каждым заказчиком.
Источник: