Исследователи убедили семейство генеративных моделей искусственного интеллекта работать вместе для решения многоэтапных задач манипулирования роботами для упаковки и сборки.
Любой, кто когда-либо пытался упаковать семейный багаж так, чтобы он уместился в багажник седана, знает, что это серьезная проблема. Роботам в настоящий момент так же сложно справляться с упаковкой множества разных товаров в одну коробку.
Для робота решение проблемы подобной упаковки включает в себя обхождение множества ограничений, таких как укладка багажа таким образом, чтобы вещи не выпали из багажника, тяжелые предметы не помещались поверх более легких. Так же есть проблема столкновений между роботизированной рукой и бампером/кузовом автомобиля.
Некоторые традиционные методы решают эту проблему последовательно, угадывая частичное решение, удовлетворяющее одному ограничению за раз, а затем проверяя, не были ли нарушены какие-либо другие ограничения. Учитывая длинную последовательность действий и кучу багажа, который нужно упаковать, этот процесс может занять непрактично много времени.
Исследователи Массачусетского технологического института использовали форму генеративного искусственного интеллекта, называемую диффузионной моделью, чтобы более эффективно решить эту проблему.
Их метод позволил генерировать эффективные решения быстрее, чем другие методы, и позволил получить большее количество успешных решений за тот же промежуток времени. Важно отметить, что их техника также позволила решать проблемы с новыми комбинациями ограничений и большим количеством объектов, которые модели не видели во время обучения.
Роботы, обученные таким образом, могут быть применены для решения широкого спектра сложных задач в самых разных условиях: от выполнения заказов на складе до организации книжной полки в чьем-то доме
«Мое видение состоит в том, чтобы заставить роботов выполнять более сложные задачи, которые имеют множество геометрических ограничений и требуют более непрерывного принятия решений — именно с такими проблемами сталкиваются сервисные роботы в нашей неструктурированной и разнообразной человеческой среде. Благодаря мощному инструменту композиционных диффузионных моделей мы теперь можем решать эти более сложные проблемы и получать отличные результаты обобщения», — говорит Чжутян Ян, аспирант электротехники и информатики MIT и ведущий автор статьи об этой новой технике машинного обучения.
Усложнения ограничений
Проблемы непрерывного выявления ограничений особенно сложны для роботов. Эти проблемы возникают при выполнении многоэтапных задач по манипулированию роботами, таких как упаковка предметов в коробку или накрытие обеденного стола. Они часто включают в себя обход ряда ограничений, включая геометрические ограничения, такие как предотвращение столкновений между манипулятором (рукой) робота и окружающей средой, физические ограничения, такие как штабелирование объектов для обеспечения их устойчивости и качественные ограничения, такие как размещение ложки справа от ножа.
Ограничений может быть много, и они различаются в зависимости от проблемы и среды в зависимости от геометрии объектов и требований, заданных человеком.
Чтобы эффективно решить эти проблемы, исследователи из Массачусетского технологического института разработали метод машинного обучения под названием Diffusion-CCSP. Модели учатся генерировать новые образцы данных, которые напоминают образцы в наборе обучающих данных, путем итеративного уточнения их выходных данных.
Для этого диффузионные модели изучают процедуру внесения небольших улучшений в потенциальное решение. Затем, чтобы решить проблему, они начинают со случайного, очень плохого решения, а затем постепенно улучшают его.
Ну и как положено, канал тг))) Канал и чатик
Там в закрепленном боты для доступа в Chat GPT и Midjourney без VPN