Исследователи из Московского физико-технического института (МФТИ) и Вычислительного центра им. А.А. Дородницына Российской академии наук (ВЦ РАН) предложили новый метод автоматического построения ранжирующих моделей.
При поиске среди миллионов файлов и документов в Интернете пользователь в ответ на короткий запрос ожидает получить небольшой полезный список. Результаты в этом списке должны быть выстроены определённым образом. Ранжирующие модели как раз и применяются для того, чтобы обработать запрос от пользователя на поиск информации.
Ранжирующая модель строится на основе простейших математических функций. Применяющийся подход предполагает создание из них сложной функции, которая бы решала поставленную задачу — поиск нужного документа по запросу небольшой длины. Работа российских учёных была направлена на оптимизацию способа построения такой модели.
Одним из методов формирования моделей является генетическое программирование. Специальный алгоритм отсеивает модели низкого качества путём «естественного отбора» и на основе оставшихся создаёт более подходящие. Лучшие варианты имеют большую вероятность быть включёнными в следующие поколения. Сменяя множество поколений, алгоритм приближается к оптимальному решению.
Но существует ряд проблем. Одна из них — необходимость длительных расчётов. Российские исследователи предложили новый подход к порождению ранжирующих моделей для поиска документов в больших коллекциях, который позволяет повысить скорость выполнения задачи в 50 раз. Кроме того, решена проблема «стагнации» — когда из-за структурной схожести моделей их «скрещивание» не даёт существенно новых результатов. Более подробно о работе исследователей можно узнать здесь.
Источник: 3DNews