На ежегодной конференции Google I/O вице-президент подразделения Google Labs Элиас Роман анонсировал инновационную функцию для платформы Flow, предназначенной для создания и редактирования видео с помощью искусственного интеллекта. Нововведение позволяет пользователям отсканировать свою внешность, создав точную цифровую копию, которую затем можно бесшовно внедрять в любые генерируемые ролики. По замыслу разработчиков, это решение станет идеальным инструментом для авторов, стремящихся присутствовать в кадре без необходимости тратить ресурсы на полноценные съёмки.
Хотя концепция создания селфи-дипфэйков вызывает ассоциации с закрытым проектом OpenAI под названием Sora, в экосистеме Google эти цифровые персонажи официально именуются аватарами. Планируется, что они будут интегрированы не только в сервис Flow, но и в возможности ИИ-ассистента Gemini, а также в платформу YouTube. Как отметил Элиас Роман, запущенный в прошлом году сервис Flow стал для Google первой линейкой продуктов, сфокусированной исключительно на творчестве, а не на программировании или повышении продуктивности.
Развитие инструментария Flow подчеркивает стратегический вектор Google на популяризацию ИИ-агентов и внедрение концепции «вайб-кодинга» в повседневную практику массового пользователя. Теперь владельцы аккаунтов могут задавать сложные повторяющиеся алгоритмы для создания видео и настраивать автоматическую систематизацию контента по заданным стилистическим критериям.

Технологическим фундаментом обновленного сервиса стала модель Omni Flash, пришедшая на смену нейросети Veo. Если ранее графическая модель Nano Banana повысила качество передачи контекста в изображениях, то Omni Flash выводит видеопроизводство на новый уровень, обеспечивая высокую детализацию каждого кадра и устраняя проблему искажения черт лица при переходе между сценами.
Процедура создания аватара максимально проста: пользователь сканирует QR-код через мобильное приложение Flow и записывает короткий видеоролик, следуя инструкциям (произношение цифр и повороты головы). Несмотря на сходство с функционалом Sora, Google вводит строгие этические рамки: генерация доступна только для личных цифровых копий, а на все результаты работы накладывается невидимая цифровая маркировка SynthID.
В ходе презентации Элиас Роман продемонстрировал возможности системы на примере ироничного ролика: его цифровой двойник, в точности повторяющий голос и мимику автора, выступал с обращением к команде разработчиков. С помощью простых текстовых запросов Роман оперативно менял фон сцены и гардероб аватара, демонстрируя мгновенную адаптивность Omni Flash.
Данная инициатива дополняет предыдущие шаги компании — так, месяц назад ограниченный инструментарий для создания аватаров был запущен в YouTube Shorts. Конкурирующие платформы также не стоят на месте: к примеру, Meta* активно развивает технологии перевода в Instagram* Reels, позволяя адаптировать мимику спикера под аудиоряд на другом языке.
Для создателей контента такие решения значительно упрощают рутинные процессы. Тем не менее, стремительное развитие генеративного ИИ вызывает неоднозначную реакцию у аудитории, которая все чаще начинает воспринимать подобный контент с долей скепсиса, пытаясь отличить реальную съемку от мастерски выполненной цифровой подделки.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Источник: iXBT

