Нейросеть от Google, похоже, создает более фотореалистичные изображения.
24 мая Google представила нейросеть Imagen, которая генерирует изображения на основе текста. Проект сразу прозвали конкурентом нейросети DALL-E от OpenAI, которая также создаёт картинки по текстовому описанию.
Создатели Imagen сами сравнили нейросеть с DALL-E 2, отмечая, что их нейросеть генерирует изображения по описанию с «беспрецедентным фотореализмом». По оценкам Google, Imagen побеждает DALL-E 2 в тестах на человеческую оценку как по точности, так и по достоверности.
Пользователь твиттера Бенджамин Хилтон сравнил работу двух нейросетей, дав DALL-E 2 текстовые запросы, аналогичные тем, что показали в релизе Imagen — пока что нейросеть от Google недоступна к тестированию и у Хилтона нет к ней доступа. Вот какие изображения у него получились.
Cлева — результат Imagen, справа — DALL-E 2
«Голубая сойка стоит на большой корзине с радужными макаронами»
«Мозг на ракетном корабле, летящем к Луне»
«Инопланетный осьминог плывёт через портал и читает газету»
«Единственный луч света входит в комнату с потолка. Луч света освещает мольберт. На мольберте картина Рембрандта с изображением енота»
«Художественная галерея с картинами Моне. Художественная галерея затоплена. Роботы плывут по художественной галерее на байдарках»
«Пара роботов на изысканном ужине на фоне Эйфелевой башни»
«Ростки в виде текста „Imagen”, растущие из книги сказок»
«Плод питайи в поясе для карате в снегу»
«Фотография собаки корги, едущей на велосипеде по Таймс-сквер. На ней солнцезащитные очки и пляжная шляпа»
«Собака с любопытством смотрит в зеркало, увидев кошку»
«Маленький кактус в соломенной шляпе и неоновых очках в пустыне Сахара»
«Мишки Тедди плавают на Олимпийских играх в заплыве на 400 метров баттерфляем»
«Гигантская кобра на ферме. Змея сделана из кукурузы»