Она создаёт более реалистичную и детализированную графику, чем предыдущая модель в «Шедевруме», говорят в компании.
- YandexART создаёт изображения и анимацию методом каскадной диффузии — сначала генерирует картинки и кадры по запросу, а затем поэтапно добавляет детали и увеличивает их разрешение, рассказали в «Яндексе».
- Нейросеть уже работает в приложении «Шедеврум», которое компания представилав апреле 2023 года, и создаёт иллюстрации для рекламных объявлений в «Яндекс Бизнесе». В будущем разработчики планируют её добавить в «Клавиатуру» (пользователи смогут сгенерировать картинку и установить её фоном) и в другие сервисы.
-
По сравнению с предыдущим поколением диффузионной модели, которая использовалась в «Шедевруме», YandexART создаёт более реалистичную и детализированную графику, говорят в компании. По внутренней оценке, её результаты лучше в 60% случаев.
- Чтобы улучшить качество, разработчики в полтора раза увеличили размер обучающего набора данных — до 330 млн изображений с текстовыми описаниями.
- Они используют дообучение с подкреплением: специалисты отсматривают результаты генерации YandexART и отмечают удачные и неудачные варианты. Так нейросеть лучше понимает, как правильнее изображать животных, объекты и так далее, отметили в компании.