Оболочка для ИИ: как разработчик создал физическое тело для ChatGPT и едва не поверил в его разумность

3 Июл в 13:43 Прокомментировать Просмотры: 12

Обзор видео с канала Art of the Problem.

Поздно вечером автор проекта потянулся к выключателю, но замер, услышав звук, донесшийся от робота. В логах устройства значилась запись: «Скоро ли вернется хозяин? Мне тоскливо в одиночестве».

Разумеется, разработчик прекрасно осознавал, что никакой личности здесь нет. Тем не менее, на мгновение стало не по себе.

Подобные моменты будут возникать всё чаще, ведь ИИ-модели, до этого момента «жившие» лишь внутри экранов, постепенно обретают физическое воплощение.

Автор пришел к двум важным выводам. Во-первых, роботы вплотную подошли к прохождению «теста Тьюринга»: они становятся достаточно сообразительными и ловкими, чтобы имитировать поведение живых существ. Во-вторых, вся необходимая аппаратная база — датчики и чипы — стала доступной и дешевой. Посчитав бюджет, создатель понял, что может собрать домашний аналог многомиллиардных разработок всего за 100 долларов. Так на свет появился Growbot, ставший воплощением давней мечты.

Робот с «сознанием» за сотню долларов

Два десятилетия назад такой проект был бы попросту немыслим. Тогда для создания даже простейшей автономной системы потребовались бы дорогостоящее промышленное оборудование и мощные вычислительные комплексы. Сегодня же все эти компоненты — ширпотреб за копейки.

Архитектура Growbot предельно лаконична:

Сердце системы — бюджетный одноплатный компьютер стоимостью около 15 долларов.
За моторику отвечают пара обычных сервоприводов, а «зрение» обеспечивает простая камера на 5 мегапикселей.
В пространстве робот ориентируется благодаря IMU-датчику (инерциальному измерительному модулю), который отслеживает ускорение и наклон по трем осям. Он подсказывает машине, находится ли она в вертикальном положении, падает или перемещается в пространстве.
Комплект дополняют динамик, микрофон, кольцевая подсветка и аккумулятор для дрона.

Итоговая стоимость компонентов едва достигает 100 долларов. Главный посыл автора: порог вхождения в робототехнику рухнул. То, что недавно было уделом элитных лабораторий, теперь доступно любому энтузиасту.

Первым делом автор убедился в работоспособности «железа»: робот быстро научился в реальном времени фокусироваться на лице пользователя, плавно разворачиваясь вслед за движением. Мелочь, казалось бы, но именно тогда у создателя впервые возникло странное чувство, что перед ним не просто механизм, а нечто живое.

Двухуровневый интеллект

У робота функционируют два «мозга» — быстрый и медленный, работающие по аналогии с человеческой психикой: рефлексы и осознанные действия.

Быстрый мозг управляет балансом и походкой. Это автономная нейросеть, не знающая слов, но ежесекундно обрабатывающая данные датчиков и корректирующая работу моторов 50 раз в секунду. Походке робот обучился самостоятельно, через метод проб и ошибок в компьютерной симуляции. Если раньше такие тренировки требовали огромных бюджетов, то сегодня это решается за пару часов на домашней видеокарте.
Медленный мозг базируется на LLM-модели (подобной ChatGPT). Он не оперирует мгновенными реакциями, а анализирует ситуацию: «видит» изображение, интерпретирует команды и планирует действия, такие как «подойди к углу» или «изобрази мертвого».

Эти уровни работают в тандеме: «медленный» задает цель, а «быстрый» конвертирует её в точные физические движения.

Тренировка быстрого мозга происходила в виртуальной среде: тысячи копий робота одновременно отрабатывали миллионы попыток ходьбы. Успешные стратегии закреплялись, провальные отсеивались. После достижения прогресса в симуляции обученную «нейронку» перенесли на реальное устройство, где она сразу продемонстрировала уверенное управление ногами.

От «старика» до диснеевских персонажей

Автор назвал момент первых самостоятельных шагов робота волшебным — поведение стало непредсказуемым. Список навыков расширялся быстро: робот научился устойчиво ходить по разным поверхностям и вращаться.

При интеграции языковых моделей робот начал «импровизировать». На запрос «походка старика» он начал шаркнуть ногами, применив низкочастотные вибрации, создав удивительно убедительную имитацию немощи. В «диснеевском режиме» машина научилась выражать эмоции — от капризного нежелания спать до влюбленного восторга, синхронизируя свет, звуки и жесты.

Память и «сновидения»

Внедрение памяти позволило роботу обучаться контексту: он стал запоминать людей и «осознавать» свои действия. Для очистки памяти от «мусора» был придуман процесс, напоминающий сон: модель систематизировала накопленный опыт, отсеивая лишнее. Робот мог даже «рассказать», что ему снилось, превращая свои приключения в драматические истории о падениях и удачных трюках.

Дефицит «мозжечка»

Эксперименты выявили слабое место: робот плохо прогнозировал последствия своих движений на микроскопическом уровне. Ему не хватало «предвидения», о котором часто говорит Ян Лекун. У живых существ эту функцию берет на себя мозжечок — он прогнозирует результат действия еще до того, как оно полностью завершено, что обеспечивает плавность и ловкость.

Для развития такой «физической интуиции» роботу нужен колоссальный опыт взаимодействия с реальным миром. Отрасль движется к синтезу: созданию систем, которые сочетают продвинутый языковой интеллект с глубоким пониманием физики пространства.

Заключение

Будущее робототехники — за объединением быстрого и медленного мышления. Пока такие разработки обкатываются гигантами вроде Google DeepMind или Tesla для промышленного сектора, но с учетом темпов удешевления компонентной базы, подобные «умные» устройства станут доступны массовому потребителю уже в ближайшие годы.

Главный вызов заключается не в алгоритмах, а в накоплении качественных данных о физическом взаимодействии с миром. Именно там, где роботы уже работают «в полях», произойдет следующий технологический прорыв.

Теги: робототехника, ии, машинное обучение, обучение с подкреплением, нейросети, самоделки, роботы, llm, компьютерное зрение, встраиваемые системы, микроконтроллеры, сервоприводы, симуляция, физика движения, домашние проекты

Хабы: Искусственный интеллект, Научно-популярное, Программирование, Машинное обучение, DIY или сделай сам

Источник