На международном мероприятии AI Journey компания Сбер презентовала предварительную версию следующего поколения нейросети под названием Kandinsky 4.0 Video, предназначенную для создания реалистичных видеоматериалов на основе текстового описания или начального кадра.
Как сообщили в пресс-службе, нейросеть можно использовать как любителями для создания анимационных роликов с пожеланиями, так и профессионалами — дизайнерами, маркетологами и аниматорами, которым Kandinsky будет полезна в создании трейлеров и музыкальных клипов.
Теперь модель позволяет создавать видеоматериалы длительностью до 12 секунд в разрешении HD (1280 x 720 пикселей) на основе любого текстового описания или произвольного стартового кадра. При этом возможно создание видео с различными пропорциями изображения.
В Сбере отметили:
Ключевыми особенностями новой версии являются улучшенное визуальное качество — высокий контраст и чёткость изображения, согласованность композиции сцены, а также реалистичность движений созданных объектов. Достижение такого уровня качества стало возможным благодаря уникальному сотрудничеству научных и инженерных команд, работавших совместно и над развитием архитектуры, и над сбором и обработкой данных для обучения модели.
Кроме того, была представлена ускоренная версия нейросети — Kandinsky 4.0 Video Flash, способная создавать видеоматериалы той же длительности в разрешении 480p (720 x 480 пикселей) всего за 15 секунд.
Первые пользователи новой версии Kandinsky Video будут художники, дизайнеры и кинематографисты. Для них модель станет доступна в рамках платформы fusionbrain.ai, предлагающей возможность создания полноценных видеопроектов — с сюжетом, полным видеорядом и музыкальным сопровождением. Для широкой аудитории доступ к нейросети будет открыт в первом квартале 2025 года.
Источник: iXBT