
Нейросети прочно вошли в повседневную жизнь и сферу цифрового творчества. В лентах соцсетей всё чаще встречаются контент-мейкеры, представленные ИИ-аватарами — синтетическими персонажами с компьютерными голосами. Хотя качество таких работ пока не всегда дотягивает до уровня человеческого исполнения, грань между реальностью и генерацией становится всё более зыбкой.
В этом материале мы протестируем четыре популярные нейросети, чтобы выяснить, какая из них лучше справляется с созданием визуального контента. Сравнение будет максимально объективным!
Формат тестирования
Мы проведем три раунда, оценивая способности моделей в следующих сценариях:
-
стандартная генерация изображения с фоновой композицией;
-
прорисовка сложных и детализированных сцен;
-
корректное отображение текста внутри изображения.
Раунд первый: персонаж-банан
Nano Banana
Начнем с проверки креативности: поставим задачу создать необычный образ банана.
Промт: «Желтый банан, являющийся представителем вымышленной организации «ба-на-на», стоит у стены с граффити. На нем халат с названием благотворительного фонда. Персонаж улыбается, держит аптечку, на голове — медицинская шапочка».
Вот какой результат выдала система:

Изображение получилось неплохим, но модель проявила излишнюю инициативу, добавив на стену надпись «HELPING HANDS», которой не было в задании. Подобные артефакты — результат «семантического наложения»: нейросеть смешала ключевые слова «благотворительность» и «граффити», выдав ассоциативный ряд в виде лозунга.
Разработчикам стоит поработать над точностью следования промту. Итоговая оценка — 6 из 10.
Nano Banana 2
Посмотрим, как с этой задачей справится обновленная версия Nano Banana 2.
Результат генерации:

Здесь всё выглядит гораздо убедительнее: картинка стала реалистичной, ушли «мультяшные» нотки, прорисовка героя стала более детальной. Смущает лишь граффити на тротуаре, но, возможно, это интерпретация процесса подготовки художника к работе. В любом случае, результат выглядит качественно. Оценка — 9 из 10.
ChatGPT
Модель от OpenAI славится вниманием к деталям. Повторим запрос с «благородным» бананом.

ChatGPT выдал результат на уровне Nano Banana 2. Модель сама попыталась адаптировать надпись на халате, что выглядит довольно осознанно. Правда, текстура «рук» персонажа вышла специфической — напоминает картофель. Тем не менее, реализм на высоте. Оценка — 8,5 из 10.
Qwen
Эта модель делает упор на фотографическую точность и эстетическую выверенность композиции.

Qwen выдал впечатляющий результат. Картинка получилась пугающе реалистичной, а граффити с изображением бананов идеально вписались в контекст. Небольшие недочеты в тексте не портят общего впечатления. За эстетику — 10 из 10.
Итог раунда
Все справились достойно, но победителем раунда становится Qwen.

Новые GPU в облаке Selectel от 196,09 ₽/час
Мощные видеокарты для ваших задач: NVIDIA® H100, H200, RTX™ 6000 Pro.
Второй раунд: детализация интерьера кабины пилота
Проверим способность нейросетей работать со сложными техническими объектами: нам нужна детализированная приборная панель самолета Boeing.

Nano Banana

Nano Banana удивил: детализация рычагов, тумблеров и индикаторов выполнена на высшем уровне. Единственный нюанс — появление самих пилотов, которых мы не запрашивали. Но за техническую проработку — 10 из 10.
Nano Banana 2

Здесь результат разочаровал: несмотря на обилие элементов, качество самих надписей и мелких узлов заметно ниже, чем в первой версии. Оценка — 5 из 10.
ChatGPT

ChatGPT демонстрирует неплохую композицию, но при попытке рассмотреть детали видны артефакты — вместо текста красуются «иероглифы». Итого — 6,5 из 10.
Qwen

Qwen оказался аутсайдером в этом раунде. Масштаб панели выглядит непропорционально, а индикаторы превратились в «цифровой шум». Оценка — 4 из 10.
Третий раунд: генерация текста
Попытаемся воспроизвести отрывок из стихотворения Пушкина «Я помню чудное мгновенье» на листе бумаги.
Nano Banana

Великолепная работа! Текст четкий, оформление профессиональное, даже авторство указано. Безоговорочные 10 из 10.
Nano Banana 2

Аналогично первой версии — отличная читаемость и структура. 10 из 10.
ChatGPT

ChatGPT не справился с задачей: текст нечитаем, буквы превращены в визуальный мусор. Оценка — 1 из 10.
Qwen

Чуть лучше, чем у ChatGPT, но до внятного текста всё еще далеко. Оценка — 3,5 из 10.
Итоги
Nano Banana и его вторая итерация — лидеры в работе с текстом и мелкими деталями. Однако у них есть проблемы с интерпретацией абстрактных запросов. Для простых и эстетичных изображений Qwen и ChatGPT остаются более универсальными и предсказуемыми решениями.