[Перевод] Ограничения формального обучения, или Почему роботы не умеют танцевать

20.09.2016

80-е годы в лаборатории информатики и искусственного интеллекта MIT казались сторонним наблюдателям чем-то вроде золотого века, но изнутри Дэвид Чапман мог наблюдать, что зима уже наступает. Будучи членом лаборатории, Чапман стал первым исследователем, применившим математику теории вычислительной сложности к роботизированному планированию, а также, к тому, чтобы показать отсутствие реального обобщённого метода создания ИИ, способного составлять план для обработки всех непредвиденных обстоятельств. Он заключил, что хотя ИИ уровня человека и может быть в принципе возможен, ни у одного из доступных нам подходов нет надежды достичь этого уровня.

В 1990-м Чапман написал, впоследствии широко распространившееся, предложение об исследовании, в котором призывал опробовать новый подход и другую задачу для ИИ: научить робота танцевать. Танец, как писал Чапман, был важной моделью, поскольку «он не достигает целей. Нельзя выиграть или проиграть. Это не задача, требующая решения. Танец – это процесс взаимодействия». Танцующие роботы требовали резкой смены приоритетов исследователей ИИ, чьи техники были построены вокруг задач типа шахмат, с чёткой структурой и недвусмысленными целями. Сложность создания танцующих роботов требовала ещё большей смены наших предположений по поводу того, что такое интеллект.

Сейчас Чапмэн пишет о практических применениях философии и когнитивистики. Недавно в интервью с журналом Nautilus он говорил о важности имитации и ученичества, ограничениях формальной рациональности, и о том, почему роботы не готовят вам завтрак.

Чем интересен танцующий робот?

Человеческое обучение – вещь социальная, осязаемая, и происходит в особых практических ситуациях. Вы не учитесь танцевать по книге или по результатам лабораторных экспериментов. Вы учитесь, танцуя с более опытными, чем вы, людьми.

Имитация и ученичество – это основные способы обучения людей. Мы забываем об этом, поскольку классные инструкции вновь стали важными в последнем столетии, и более заметными.

Я решил перенести фокус обучения на развитие. «Обучение» подразумевает окончание – как только вы что-либо изучили, вы закончили. «Развитие» означает продолжающийся бесконечный процесс. По танцам не делают экзаменов, после которых вы заканчиваете обучение.

Это был серьёзный отход от традиционного подхода к обучению ИИ, не так ли?

Да, в первые десятилетия исследователи ИИ сосредоточились на тех задачах, которые особенно связываются с интеллектом, поскольку для людей они трудны: к примеру, шахматы. Оказывается, что для достаточно быстрых компьютеров шахматы просты. В ранних работах игнорировали простые для людей задачи: приготовление завтрака, к примеру. Такие простые задачи оказались сложными для компьютеров, контролирующих роботов.

Ранние попытки исследований вопросов обучения ИИ также занимались формальными проблемами, типа шахмат, в которых можно игнорировать тела, социальный и практический контексты. Последние исследования показывают впечатляющий прогресс в практических задачах реального мира, типа распознавания образов. Но всё ещё не видно успехов в социальных и фзических ресурсах, критичных для человеческого обучения.

Чему может научить нас Хайдеггер по поводу интеллекта и обучения?

Формальная рациональность, использующаяся в науке, инженером деле, математике, за несколько последних столетий обеспечила множество прорывов. Естественно принимать её за суть интеллекта, и предполагать, что она лежит в основе функционирования человека. Десятилетиями аналитические философы, психологи-когнитивисты, и исследователи ИИ безоговорочно принимали, что люди сначала при помощи логики создают рациональный план, а потом исполняют его. В середине 1980-х стало очевидно, что по техническим причинам обычно это просто невозможно.

Философ Хьюберт Дрейфус предвидел этот тупик ещё за десять лет до его возникновения, в своей книге «Чего не могут компьютеры». Он исходил из анализа Хайдеггером рутинных практических действий, таких, как приготовление завтрака. Такие физические навыки, по-видимому, не требуют формальной рациональности. Более того, наша возможность заниматься формальными рассуждениями зависит от нашей возможности заниматься практическими, неформальными и физическими вещами – но не наоборот. Когнитивистика поняла всё с точностью до наоборот! Хайдеггер предположил, что большая часть жизни похожа на завтрак, и не похожа на шахматы.

Мы с коллегой Филом Эйгром [Phil Agre] разработали новые, интерактивные вычислительные подходы к практическим занятиям, не включающие формальных рассуждений, и показали, что они могут быть гораздо эффективнее традиционных логических парадигм. Однако наши системы необходимо программировать вручную, что кажется непрактичным для задач чуть более сложных, чем видеоигры. Следующим шагом должны стать системы ИИ, вырабатывающие навыки без непосредственного их программирования.

Хайдеггер мало что сказал про обучение, но его мысль о том, что человеческие занятия всегда имеют социальный аспект, была ключевой. Мы с Филом вдохновились школами антропологии, социологии и социальной психологии развития (некоторые из которых, в свою очередь, вдохновлялись и Хайдеггером). Мы начали разработку вычислительной теории обучения через ученичество. Статья про танцующих роботов частично обрисовывает наши стремления. Вскоре после этого мы поняли, что превратить эти идеи в работающие программы пока не представляется возможным.

Постройка физического робота несёт в себе множество сложностей – например, нужно, чтобы он не падал – не имеющих, на первый взгляд, прямого отношения к обучению и интеллекту. Почему бы не начать создание танцующего робота с компьютерной анимации?

Одна из сложностей рационалистского подхода к ИИ заключается в том, что мы не можем построить абсолютно точную модель реального мира. Он очень неаккуратный. У ложки ягодного варенья нет определённой формы. Оно липкое, податливое, текучее. Оно неоднородное – частично протёртые ягоды ведут себя не так, как жидкие части. На атомном уровне оно подчиняется законам физики, но готовить с их помощью завтрак – это непрактично.

Таковы и наши тела. Мускулы – это мешки желе с вкраплениями растягивающихся нитей. Кости – неправильной формы, соединены эластичными сухожилиями, в результате чего суставы поддаются по сложной схеме, приближаясь к лимиту прочности.

Используя физические симуляции, можно заставить анимированную фигурку танцевать. Она может казаться очень реалистичной. Но эти методы не работают с роботами для выполнения простейших человеческих задач. Танцы или приготовление завтрака всё ещё находятся за пределами возможностей современной науки.

Физические симуляции работают плохо, потому что тела роботов, как и людей, несовершенны. Большинство современных разработок пытается привязать роботов к простым физическим моделям, делая их прочными и твёрдыми, и настолько точно изготовленными, насколько это возможно. Но всё равно у них проявляются и гибкость, и ограничения, и непостоянство, из-за чего их сложно контролировать. Также им приходится быть очень тяжёлыми и мощными, что делает их опасными и неэффективными.

В статье «танцующие роботы» я предложил бросить этот подход, и, используя машинное обучение, найти способы контроля над лёгкими, более слабыми и более гибкими роботами. Подобно ребёнку, система должна постепенно вырабатывать физические навыки через опыт. Тогда у нас не было достаточных компьютерных мощностей, но некоторые исследователи в последнее время достигли успеха с таким подходом.

Создаётся впечатление, что эта тема в вашей работе повторяется. Мы хотим жёсткого и абсолютного мира, а он сложный и неоднородный.

Да. Моя последняя работа о «смыслах» предлагает работать во взаимодействии неопределённости и шаблонов, чтобы улучшить понимание и действия. Это «практическая философия» для личной эффективности, исходящая из работы, которую я делал в области ИИ, и академических областей, упоминавшихся мною ранее. У неё есть и размерность для обучения. Исследование развития взрослых людей показывают, что люди могут развиваться через до-рациональный, рациональный и мета-рациональный пути понимания. Среднее состояние крайне жёсткое. В нём есть представление, что мир можно подстроить под системы. Этот подход может быть неуклюжим, неэффективным и неустойчивым.

Если барьер, отделяющий нас от идеально точных моделей, фундаментальный, а не технологический, потребуется ли нам совершенно другой подход к ИИ?

Основной подход из 1970-х и 1980-х точно провалился, и именно по этой причине. «Глубокое обучение», добившееся поразительных результатов, более гибкое. Оно строит статистические и неявные модели, вместо абсолютных и логических. Однако оно требует огромных объёмов данных, а люди часто обучаются с единственного примера. Будет очень интересно обнаружить область действия и ограничения подхода глубокого обучения.

Источник

глубокое обучение, машинное обучение