Яндекс анонсировал обновлённую визуальную нейросеть — YandexART 2.0. По сообщению пресс-службы, усовершенствованная модель стала лучше интерпретировать запросы пользователей, охватывая больше деталей. Новая версия позволяет внедрять сочетания различных стилей в одном изображении, генерировать логотипы и добавлять текст на латинице.
В Яндексе отметили:
Пользователи могут использовать обновлённые функции для развития своего бизнеса: создать фирменный логотип, оформить этикетку продукта, подготовить иллюстрации для веб-сайтов и социальных сетей, а также компании смогут повысить эффективность своих рекламных и маркетинговых кампаний.
Ядром YandexART 2.0 стала собственная разработка компании — инновационная гибридная архитектура, объединяющая преимущества свёрточных и трансформерных нейросетей. Свёрточная модель действует схоже с человеческим зрением, улавливая значимые элементы, такие как границы, текстуры и формы. Однако для обработки сложного контекста трансформеры более подходящи. Слияние этих двух подходов в YandexART 2.0 позволило более точно следовать текстовым запросам.
YandexART была обучена на сотнях миллионов пар изображений и их текстовых описаний. Для повышения точности и качества описаний Яндекс применял собственную модель VLM, которая анализировала изображения и давала детализированное описание содержимого. Улучшенные данные способствовали лучшему восприятию моделью YandexART 2.0 деталей пользовательских запросов.
Источник: iXBT