Битва нейросетей: кто лучше рисует бананы — Nano Banana, Qwen или ChatGPT?

8 минут назад

Нейросети прочно вошли в повседневную жизнь и сферу цифрового творчества. В лентах соцсетей всё чаще встречаются контент-мейкеры, представленные ИИ-аватарами — синтетическими персонажами с компьютерными голосами. Хотя качество таких работ пока не всегда дотягивает до уровня человеческого исполнения, грань между реальностью и генерацией становится всё более зыбкой.

В этом материале мы протестируем четыре популярные нейросети, чтобы выяснить, какая из них лучше справляется с созданием визуального контента. Сравнение будет максимально объективным!

Формат тестирования

Мы проведем три раунда, оценивая способности моделей в следующих сценариях:

стандартная генерация изображения с фоновой композицией;
прорисовка сложных и детализированных сцен;
корректное отображение текста внутри изображения.

Раунд первый: персонаж-банан

Nano Banana

Начнем с проверки креативности: поставим задачу создать необычный образ банана.

Промт: «Желтый банан, являющийся представителем вымышленной организации «ба-на-на», стоит у стены с граффити. На нем халат с названием благотворительного фонда. Персонаж улыбается, держит аптечку, на голове — медицинская шапочка».

Вот какой результат выдала система:

Изображение получилось неплохим, но модель проявила излишнюю инициативу, добавив на стену надпись «HELPING HANDS», которой не было в задании. Подобные артефакты — результат «семантического наложения»: нейросеть смешала ключевые слова «благотворительность» и «граффити», выдав ассоциативный ряд в виде лозунга.

Разработчикам стоит поработать над точностью следования промту. Итоговая оценка — 6 из 10.

Nano Banana 2

Посмотрим, как с этой задачей справится обновленная версия Nano Banana 2.

Результат генерации:

Здесь всё выглядит гораздо убедительнее: картинка стала реалистичной, ушли «мультяшные» нотки, прорисовка героя стала более детальной. Смущает лишь граффити на тротуаре, но, возможно, это интерпретация процесса подготовки художника к работе. В любом случае, результат выглядит качественно. Оценка — 9 из 10.

ChatGPT

Модель от OpenAI славится вниманием к деталям. Повторим запрос с «благородным» бананом.

ChatGPT выдал результат на уровне Nano Banana 2. Модель сама попыталась адаптировать надпись на халате, что выглядит довольно осознанно. Правда, текстура «рук» персонажа вышла специфической — напоминает картофель. Тем не менее, реализм на высоте. Оценка — 8,5 из 10.

Qwen

Эта модель делает упор на фотографическую точность и эстетическую выверенность композиции.

Qwen выдал впечатляющий результат. Картинка получилась пугающе реалистичной, а граффити с изображением бананов идеально вписались в контекст. Небольшие недочеты в тексте не портят общего впечатления. За эстетику — 10 из 10.

Итог раунда

Все справились достойно, но победителем раунда становится Qwen.

Новые GPU в облаке Selectel от 196,09 ₽/час

Мощные видеокарты для ваших задач: NVIDIA® H100, H200, RTX™ 6000 Pro.

Узнать больше →