Монорельс в свое время протрубил громко, как технология будущего, но будущее это так и не наступило. Упаднический прогноз давали VR-очкам, но он, к счастью, не сбылся. Теперь на повестке нескольких лет беспилотные автомобили. С ними вообще все неоднозначно: кто-то считает эту технологию невозможной в принципе, кто-то, наоборот, верит в то, что беспилотники спасут нас от ДТП на дорогах, другие рассуждают о юридических аспектах и беспрецедентных проблемах с безработными водителями. О мифах и слабых местах технореалий рассказал Вадим Вашкелис, руководитель практики Intelligent Automation.
Взгляд на компьютерное зрение
Я закончил Санкт-Петербургский государственный электротехнический университет «ЛЭТИ», а позже защитил диссертацию на тему обработки и распознавания изображений. В 2007 году в собственной компании мы с коллегами разрабатывали технологии, связанные с навигацией автономных систем, роботов, беспилотной техники. Это был огромный и богатый опыт. Теперь я занимаюсь этими вопросами в центре компетенций по компьютерному зрению компании EPAM.
Внутри EPAM нет отдельной разработки решений для беспилотников, однако мы обладаем мощной экспертизой в компьютерном зрении для медицины, ритейла, распознавания документов, которая может быть экстраполирована на беспилотные автомобили и стать большим направлением разработки для автомобильной индустрии. Главное, у нас есть огромный опыт в области обучения, управления данными и датасетами нейронных сетей. В EPAM этим занимаются Центр компетенций Computer Vision и Data Science-практика. Команда тестирует проекты, предлагает новые технологии, в ее составе сейчас задействовано около 40 специалистов.
Создаем беспилотник
Если бы мы хотели создать беспилотник в 2020 году, то любой инженер из этой области уверил бы нас, что уже существуют все возможности и программные и технические средства. Нужно всего лишь взять из Open Source готовую сетку для детекции объектов, обучить ее с применением Transfer Learning, добавить распознавание разметки (посмотрев тренинги на Coursera), все это положить на GPU — и наш прототип почти готов. Более того, не исключено, что даже при езде по дорогам общего пользования наш автомобиль будет двигаться самостоятельно по всем правилам. Особенно если условия окажутся такими:
Но довольно скоро мы поймем, что дорожные условия не всегда оказываются идеальными. Они могут быть такими:
Или, например, такими:
Первые проблемы в создании беспилотника
Во-первых, если говорить совсем просто, то чтобы автомобиль мог ездить, ему нужно научиться распознавать огромное количество объектов: знаки, людей, животных, погодные условия и многое другое. Но это только начало.
Кроме того, нам надо уметь понимать, с какой скоростью и в каких направлениях будут двигаться все эти объекты и где они могут оказаться в следующий момент. Да и вообще, на дороге ведь могут быть препятствия, которые не так просто распознать: куча песка, сугроб, большая лужа, выпавший из грузовика шкаф.
Для решения этой задачи требуется комплексный подход с применением различных нейронных сетей, классических алгоритмов компьютерного зрения, аналитических алгоритмов и многого другого.
Отдельная часть работы над зрением беспилотника — сбор такого массива данных и его аннотирование. По сути, в эти массивы должны войти все объекты, которые вокруг нас находятся. Наилучшие результаты в этой области показывают корпорации вроде Google и Tesla, ведь такие задачи требуют дорогих и сложных подходов. Но и мы достигаем неплохих результатов, просто в других масштабах.
Во-вторых, зрение человека как система — это абсолютно уникальный аппарат. Физическая разрешающая способность пары глаз обычного человека превышает 250 Mpx. Более того, согласно различным экспериментам, после обработки графической информации мозгом мы видим перед собой картинку в качестве 500-600 Mpx. Конечно же, это несравнимо с 4К- и 8К-технологиями. Но даже это не столь важно, у нашего глаза потрясающий динамический диапазон — примерно в 24 f-ступеней, то есть разница между минимальной и максимальной яркостью, которую может регистрировать наш глаз, составляет примерно 2^24. Современные же матрицы обладают диапазоном в 8-10 f-ступеней.
В-третьих, мы должны уметь прогнозировать все возможные условия и сценарии, в-четвертых — обладать мощными аппаратными платформами, на которых будут запускаться нейросетевые модели, в-пятых — обладать адекватной архитектурой и многим другим.
Наверное, все вышесказанное должно убедить в том, что создание беспилотного автомобиля — это невыполнимая задача, но я предлагаю рассмотреть, какие решения уже существуют.
Два пути
В мире беспилотного транспорта есть две «религии» Waymo (беспилотный проект Google) и Tesla.
Приверженцы первого пути верят, что выходить на рынок можно только с полноценной реализацией беспилотной технологии. Вторая группа исповедует инкрементальную модель, то есть сейчас мы умеем держаться в полосе, потом добавим смену полос, затем научимся проезжать перекрестки и заезжать в гаражи, а в итоге получим полное автономное вождение.
Самое дорогое в мире нейронных сетей сейчас — это обучение. Сделать этот процесс быстрым и эффективным достаточно сложно. Поэтому, несмотря на идеологическую разницу, все компании применяют схожие подходы к исследованиям в области беспилотных технологий, то, что называется AutoML. Например, в Waymo это использование NAS-элементов (Neural Architecture Search) — маленьких кусочков нейросети, и поиск оптимальной архитектуры для них с помощью последовательного перебора их различных конфигураций. При таком подходе могут рассматриваться больше 10 тысяч комбинаций, из которых будет выбрано и обучено 100 потенциально приемлемых «кандидатов», но после их сравнения останется только один победитель.
Второй общий подход — это работа с обучающими выборками и датасетами для всевозможных погодных и дорожных условий, всех потенциальных участников дорожного движения, для обучения моделей поведения и всего того, о чем мы уже говорили. Получить их можно двумя способами: полностью воссоздав компьютерную симуляцию мира, что маловероятно, или взяв данные с уже существующих автомобилей.
На сегодняшний день почти полмиллиона автомобилей Tesla проехали в режиме беспилотного вождения без малого 2 миллиарда километров по дорогам общего пользования. Это дает Tesla колоссальное преимущество, поскольку в ее автомобилях автопилот работает непрерывно, даже если он не активирован. Причем он постоянно сравнивает свои предсказания с тем, что делает водитель, и это дает ему возможность непрерывно обучаться. Кроме того, за счет этого Tesla обладает, вероятно, самым большим набором датасетов, собранных на реальных дорогах, в реальных условиях.
Беспилотники — это новый блокчейн?
Последние несколько лет мы прожили под звездой блокчейна. Нам казалось, что блокчейн заменит деньги, документы и все остальное. Но пока это во многом остается нишей биткойн-спекулянтов. Не будет ли той же ситуации с автономными автомобилями?
С одной стороны, стоимость услуг водителя с учетом налогов может обходиться компании в условные $50 000 в год + страховка + амортизационные расходы и так далее. Беспилотный автомобиль такие затраты просто удаляет. Это и является драйвером — коммерческая выгода. С другой, стоимость оборудования для создания БПА сильно влияет на его цену. Например, Google на заре своего проекта оснащала машины лидарами (устройствами для получения и обработки информации об удаленных объектах с помощью активных оптических систем) стоимостью 70-80 тысяч долларов. Благодаря развитию технологий такие устройства становятся все доступнее и продолжают дешеветь, и те же лидары стоят уже 6-8 тысяч долларов. Однако вместе с ними мы должны оснастить автомобиль множеством других сенсоров, продвинутой бортовой электроникой и прочим. И если мы планируем переделать условный автомобиль за 40 тысяч долларов, обвесив всем этим железом, то на выходе получим тот же самый автомобиль, который иногда умеет ездить сам, но уже за 80 тысяч долларов.
Однако корпорации все равно тратят миллиарды долларов на разработку проектов беспилотных автомобилей, и в этом они ушли далеко. Прогнозы, когда именно БПА запустятся массово, разнятся. На мой взгляд, к концу следующего десятилетия процент такого транспорта уже будет существенным.
Например, совсем недавно компания UPS объявила о закупке 10 000 беспилотных грузовиков и, как ожидается, именно с коммерческого транспорта и такси должен начаться расцвет беспилотных технологий.
Прекрасное будущее беспилотников
Сторонникам БПА придется потратить время на решение юридических вопросов, но это не самая большая проблема. Беспилотникам необходимы лицензии для допуска на дороги общего пользования, и в США такие лицензии уже сформированы и выданы в некоторых регионах. Тестируются такси, автомобили и в Европе: результаты неплохие, в том числе с точки зрения безопасности.
Дальнейшая судьба распространения БПА зависит от регулирующих органов: тут кроется основной ответ на вопрос, как быстро и широко технология войдет в часть автомобильного ландшафта. Если бы законодательство позволяло, то БПА могли бы уже сейчас использоваться гораздо шире.
Нужно делать поправку на то, что тестирование в США и Европе проходит в хороших условиях, с четкой разметкой и в сухую погоду. В России у таких авто будут другие проблемы. Но если люди могут ездить без разметки и в плохую погоду, то, скорее всего, такая задача по силам и искусственному интеллекту.
Тридцать лет назад многие говорили, что персональный компьютер заменит бухгалтеров, инженеров, архитекторов и оставит их всех без работы. Однако этого не произошло, наоборот, благодаря ПК появилось множество новых рабочих мест и профессий. Беспилотный автомобиль изменит рынок труда, и профессия водителя, возможно, умрет так же, как умерла профессия кучера. Но появится новая индустрия, новые специализации. Скорее всего, массовое использование БПА повлияет на развитие дорожной инфраструктуры и паттерны поведения в отношениях автомобилей и автомобилистов. Вероятно, частным лицам не придется владеть машиной: для этого будут существовать сервисы аренды. В общем, последствия для жизни и экономики будут, но скорее хорошие, чем апокалиптические.