Google позволила пользователям создавать ИИ-клоны для видео

На ежегодной конференции Google I/O вице-президент подразделения Google Labs Элиас Роман анонсировал инновационную функцию для платформы Flow, предназначенной для создания и редактирования видео с помощью искусственного интеллекта. Нововведение позволяет пользователям отсканировать свою внешность, создав точную цифровую копию, которую затем можно бесшовно внедрять в любые генерируемые ролики. По замыслу разработчиков, это решение станет идеальным инструментом для авторов, стремящихся присутствовать в кадре без необходимости тратить ресурсы на полноценные съёмки.

Хотя концепция создания селфи-дипфэйков вызывает ассоциации с закрытым проектом OpenAI под названием Sora, в экосистеме Google эти цифровые персонажи официально именуются аватарами. Планируется, что они будут интегрированы не только в сервис Flow, но и в возможности ИИ-ассистента Gemini, а также в платформу YouTube. Как отметил Элиас Роман, запущенный в прошлом году сервис Flow стал для Google первой линейкой продуктов, сфокусированной исключительно на творчестве, а не на программировании или повышении продуктивности.

Развитие инструментария Flow подчеркивает стратегический вектор Google на популяризацию ИИ-агентов и внедрение концепции «вайб-кодинга» в повседневную практику массового пользователя. Теперь владельцы аккаунтов могут задавать сложные повторяющиеся алгоритмы для создания видео и настраивать автоматическую систематизацию контента по заданным стилистическим критериям.

Google позволила пользователям создавать ИИ-клоны для видео
Источник: Google

Технологическим фундаментом обновленного сервиса стала модель Omni Flash, пришедшая на смену нейросети Veo. Если ранее графическая модель Nano Banana повысила качество передачи контекста в изображениях, то Omni Flash выводит видеопроизводство на новый уровень, обеспечивая высокую детализацию каждого кадра и устраняя проблему искажения черт лица при переходе между сценами.

Процедура создания аватара максимально проста: пользователь сканирует QR-код через мобильное приложение Flow и записывает короткий видеоролик, следуя инструкциям (произношение цифр и повороты головы). Несмотря на сходство с функционалом Sora, Google вводит строгие этические рамки: генерация доступна только для личных цифровых копий, а на все результаты работы накладывается невидимая цифровая маркировка SynthID.

В ходе презентации Элиас Роман продемонстрировал возможности системы на примере ироничного ролика: его цифровой двойник, в точности повторяющий голос и мимику автора, выступал с обращением к команде разработчиков. С помощью простых текстовых запросов Роман оперативно менял фон сцены и гардероб аватара, демонстрируя мгновенную адаптивность Omni Flash.

Данная инициатива дополняет предыдущие шаги компании — так, месяц назад ограниченный инструментарий для создания аватаров был запущен в YouTube Shorts. Конкурирующие платформы также не стоят на месте: к примеру, Meta* активно развивает технологии перевода в Instagram* Reels, позволяя адаптировать мимику спикера под аудиоряд на другом языке.

Для создателей контента такие решения значительно упрощают рутинные процессы. Тем не менее, стремительное развитие генеративного ИИ вызывает неоднозначную реакцию у аудитории, которая все чаще начинает воспринимать подобный контент с долей скепсиса, пытаясь отличить реальную съемку от мастерски выполненной цифровой подделки.

* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена

 

Источник: iXBT

Читайте также