Маленькие дети прекрасно понимают, что будет, если перевернуть стакан с соком. А вот машины нет. Несмотря на все многообразие современных алгоритмов компьютер не в состоянии предсказать последствия того либо иного своего действия. Конечно, если этот компьютер специально не обучить.
Группа исследователей из Института искусственного интеллекта Пола Аллена (Allen Institute for Artificial Intelligence, AI2) разработала программу, которая помогает слабой форме ИИ «понять», что произойдет при выполнении того либо иного действия. ПО «предсказывает» будущее, показывая, как может повести себя тот либо иной объект в определенных условиях. Это, говорят ученые, поможет ИИ делать меньше ошибок. Например, автономный автомобиль сможет «предсказать» последствия развития той либо иной ситуации на дороге.
Система, разработанная Рузбехом Моттаги (Roozbeh Mottaghi) и его коллегами, демонстрирует особенности ряда объектов. В программной платформе, созданной учеными, используется машинное обучение и 3D моделирование. Исследователи преобразовали более, чем 10 000 изображений в объемные сцены. Для этого использовался специализированный 3D движок.
После преобразования исходные изображения и их объемные аналоги загружались в нейронные сети. В результате компьютерная система понемногу обучалась на примере простых 3D объектов и движений этих объектов. После того, как система получила определенное количество пар «изображение — 3D модель», она научилась самостоятельно предполагать, какие силы могут быть приложены к трехмерному объекту, и какие могут быть последствия проявления этих сил.
Нельзя сказать, чтобы работа шла очень гладко. Но ситуаций, в которых компьютер мог предсказать поведение трехмерного объекта при взаимодействии с ним, оказалось больше, чем ситуаций, когда машина не понимала, что может случиться. ИИ «понял», например, что если степлер, лежащий на краю стола, толкнуть, то он упадет. Также система успешно показала ситуацию с кофейным столиком и диваном. ИИ смог «понять», что если кофейный столик двигать направлению к дивану, то столик непременно упрется в диван и дальше двигаться не сможет.
«Наша цель — изучить динамику физического движка. Вы должны научиться предсказывать возможное поведение объектов представленной сцены», — говорит руководитель проекта.
Результаты этой работы могут быть полезными для многих сфер. Так, далеко не везде применим метод проб и ошибок. В случае робомобиля это абсолютно исключено. Компьютер должен предсказывать возможное развитие ситуации, и делать это очень быстро. Сбор и анализ данных в таких ситуациях — это очень важно. Здесь можно привести еще один пример. Система обслуживания клиентов в магазине тоже не может сталкивать с полок товары, для того, чтобы понять последствия своих действий. Это дорого обойдется владельцу магазина и отпугнет клиентов.
Работа, которую выполняют ученые, является частью проекта Project Plato. Его цель — дать роботизированным системам возможность понимать последствия своих действий без проверки этого на практике. В частности, системы со слабой формой ИИ, которые используется в проекте, понимают, как будет двигаться лыжник, спускающийся с горы. Они понимают и то, как будет двигаться футбольный мяч, который только что отправил в полет футболист. Такие события и их последствия ИИ должен научиться понимать в режиме реального времени.
За последние годы компьютерные системы заметно «поумнели». Они уже могут анализировать изображения с последующей разбивкой по категориям, идентификацией элементов изображений и тегированием. Брендэн Лейк (Brendan Lake), специалист из Нью-Йоркского университета, считает, что проект Ai2 является важным для современного мира. «Понимание сцены — это гораздо сложнее, чем распознавание объектов», — говорит Лейк. «Когда человек видит кадр какой-либо сцены, он в состоянии рассказать целую историю о том, что происходит или что может происходить на указанном кадре». В идеале, машина должна уметь то же самое.
Конечно, пока что человек значительно превосходит возможности машины в приведенном примере. Но задача ученых — научить компьютерные системы анализировать возможные последствия своих действий. О том, чтобы компьютеры в этом смысле стали равны человеку или превзошли его, пока речи нет. Но и на текущем этапе это может быть очень полезным для целого ряда сфер.
Ученые, принимающие участие в проекте, не скрывают результаты своей работы. Исходный код, набор данных и все остальное можно получить по этой ссылке для самостоятельного изучения.