Стратегического покерного бота Libratus адаптировали для военных симуляторов

Стратегического покерного бота Libratus адаптировали для военных симуляторовВ 2017 году покерный бот Libratus попал в заголовки СМИ, когда обыграл четырёх профессионалов в безлимитный холдем на дистанции 120 000 рук. Теперь технологию адаптировали для военного применения.

Разработчики систем слабого ИИ часто сравнивают эффективность своих программ в игровом противостоянии против человека. В играх с полной информацией в любой момент игры все игроки имеют полную информацию о состоянии игры, то есть о позиции и всех возможных ходах любого из игроков. В отличие от таких детерминированных ситуаций, в играх с неполной информацией часть информации о состоянии игры скрыта от игрока — например, карты оппонента. Безлимитный холдем как раз одна из таких игр. Кроме закрытых карт оппонента, добавляется здесь элемент неопределённости за счёт произвольного размера каждой ставки. С учётом этого количество возможных исходов оценивается в 10161. Выработка оптимальной стратегии в условиях неопределённости с учётом тактики оппонента — именно то, что нужно военным.

Libratus («сбалансированный» с латинского языка) создан исследователями из Университета Карнеги-Меллона для тестирования идей автоматизированного принятия решений на основе теории игр. В начале прошлого года, после громкой победы над профессионалами, ведущий автор программы, профессор Туомас Сандхолм, основал стартап под названием Strategy Robot, чтобы адаптировать игровую технологию для использования правительством. Например, в военных играх и симуляциях для изучения военной стратегии и планирования. В конце августа, согласно публичным записям, компания заключила двухлетний контракт с армией США на сумму до $10 млн. Финансирование выделено Отделением оборонных инноваций (Defense Innovation Unit), которое Пентагон образовал в 2015 году для улучшения контактов с компаниями Кремниевой долины и более активного внедрения новых технологий.


Стратегия Libratus на различных этапах раздачи. По итогам раздачи модель игры против конкретного оппонента уточняется

Libratus построен на алгоритмической (вычислительной) теории игр. В хэдзапах с профессионалами бот выиграл более 1,8 миллиона условных долларов: на протяжении турнира он разработал мощные стратегии ставок и даже продемонстрировал возможность блефа.

Сандхолм уверен, что этот подход применим ко многим другим играм, а также военным симуляторам. Сейчас военные игровые упражнения обычно проверяют только небольшое количество стратегий для воображаемых противников: «Это открывает перед вами много возможностей для эксплуатации, потому что настоящий противник может играть не в соответствии с вашими предположениями», — говорит профессор.

Сандхолм отказывается обсуждать специфику проектов Strategy Robot, хотя фирма заключила ещё как минимум один государственный контракт. Он говорит, что программа помогает в имитационных задачах, которые включают в себя принятие решений в моделируемом физическом пространстве, например, где разместить воинские части.

Покерная техника Libratus позволяет предположить, что стратегический бот может дать военным некоторые удивительные рекомендации. Профессиональные игроки, которые противостояли боту, по ходу турнира с удивлением обнаружили, что он неожиданно переключается с тайтовой на гиперагрессивной тактику, так что его действия практически невозможно предсказать — но все действия бота строго нацелены на победу. «Это странно, потому что нет впечатления, что он играет лучше вас, но затем вы смотрите на счёт и понимаете, что произошло», — говорит Сандхолм.

По мнению специалистов, подобные технологии могут сделать военные игры и симуляции более полезными, хотя результаты всё равно останутся лишь одним из компонентов стратегического планирования. Реальный мир намного сложнее и запутаннее, чем сценарии, которые способны освоить даже лучшие технологии ИИ.

Стратегический бот Libratus — не единственная попытка Пентагона применить современную теорию игр и слабый ИИ в военном деле. Исследовательское агентство DARPA запустило специальную программу «Последовательное взаимодействие в играх с неполной информацией применительно к принятию сложных военных решений (SI3-CMD)». Майкл Уэллман, профессор Мичиганского университета, говорит, что пример Libratus показывает: технология почти созрела для реального применения: «Прорыв в покере был просто поразительным, и с другими играми дела идут быстро. Пришло время попробовать это в более реальных областях», — сказал он.

Кроме Strategy Robot, профессор Сандхолм основал ещё один стартап Strategic Machine, где адаптирует стратегического бота для коммерческих задач, таких как рынки электроэнергии, спорт и компьютерные игры.

Технологии ИИ интересуют военных не только США, но также России и Китае, пишет Wired. Профессор Сандхолм не разделяет опасения по этому поводу. Он считает, что ИИ «сделает мир намного безопаснее».

 
Источник

Читайте также