YandexART: улучшения нейросети для реалистичных изображений

24 Апр в 11:11

Команда Яндекса представила новую версию диффузионной нейросети Yandex AI Rendering Technology (YandexART), которая создаёт изображения и анимацию в ответ на текстовые запросы пользователей.

YandexART: улучшения нейросети для реалистичных изображений

YandexART 1.3. перешла на новую технологию для генерации изображений — латентную диффузию. Кроме того, датасет, на котором обучалась модель, был увеличен в 2,5 раза. Благодаря этому YandexART лучше понимает текстовые запросы и создаёт ещё более реалистичные изображения в разных форматах.

Яндекс обновил YandexART: нейросеть лучше понимает запросы и создаёт более реалистичные картинки в разных форматах

В пресс-службе пояснили:

Технология латентной диффузии потребляет меньше вычислительных ресурсов и позволяет создавать более реалистичную графику. Она формирует промежуточное представление картинки в виде латентного кода — компактного описания, содержащего основную информацию об изображении в сжатой форме. Затем нейросеть за один шаг разворачивает код в полноценное изображение высокого разрешения. Такой подход более эффективен, чем многоэтапное уточнение картинки в каскадной диффузии.

Кроме того, обновление YandexART даст пользователям возможность создавать изображения в разных форматах, таких как 16:9, 4:3 или 3:4.