Способны ли нейросети создавать настоящее искусство?

1 Май в 15:39

Современные генеративные модели виртуозно воспроизводят манеру прославленных живописцев — от Ван Гога до Ренуара. Однако, как правило, подобная стилизация легко распознается при первом же взгляде. Возникает вопрос: под силу ли алгоритмам создать абстрактную композицию, способную ввести в заблуждение даже искушенного искусствоведа? И как найти объективный критерий для определения авторства? Мы провели своего рода исследование на стыке искусственного интеллекта и нейроэстетики, результаты которого заставляют по-новому взглянуть на горизонты искусства.

Нейросети давно освоили имитацию авторских стилей. Достаточно упомянуть имя Ван Гога или Ренуара в запросе, чтобы получить результат с характерными чертами их письма. Разумеется, ценитель или профессиональный исследователь мгновенно распознает подделку. Нейросетевые модели часто грешат неточностями: в исторических костюмах внезапно появляются современные аксессуары, на натюрмортах — анахроничные предметы, а перспектива и текстурные решения искажаются.

Впрочем, существует область абстрактного искусства, лишенная буквальных элементов, способных выдать цифровое происхождение работы. Стоит задуматься: сможет ли ИИ сгенерировать такую абстракцию, которая заставит знатока сомневаться — сотворена она человеком или машиной? И, что еще важнее, как это проверить беспристрастно? Опросы требуют масштабной выборки и серьезной статистики. Для локальных экспериментов куда эффективнее опираться на измеримые числовые показатели.

Здесь на помощь приходит нейроэстетика — дисциплина, стремящаяся объяснить наши представления о красоте и гармонии не через абстрактную философию, а через анализ сенсорных реакций мозга и количественных характеристик изображений. Ключевыми метриками для абстракции служат фрактальная размерность, мультифрактальный спектр, энтропия и анизотропность.

Фрактальная размерность определяет степень заполненности пространства сложными структурами. Условно, линия имеет размерность 1, залитый цветом холст — 2, а абстрактные композиции варьируются в промежуточных значениях.

Мультифрактальный спектр характеризует структурную неоднородность: разнообразие элементов по масштабу — от масштабных пятен до тончайших нюансов. Чем шире этот спектр, тем богаче и выразительнее структура.

Энтропия Шеннона количественно выражает информационную насыщенность или хаос. Более высокое значение указывает на визуальную плотность, где предсказать последующий пиксель практически невозможно.

Наконец, анизотропность отражает направленность структуры. Значение, близкое к нулю, указывает на хаотичность без выраженных векторов, тогда как близость к единице означает наличие четко считываемого направления.

Эти показатели легли в основу моего эксперимента: я сгенерировала абстрактные работы в духе Поллока и сопоставила их с оригиналом, используя упомянутые метрики.

Для генерации использовался константный промт:

Abstract square canvas densely covered with chaotic splatters and drops of paint in warm ochre, red, and brown tones, reminiscent of Jackson Pollock's Number 5 style. Paint layers overlap creating a complex texture with large spots and scattered fine splashes. Background is light, subtly textured cream, contrasting with dense strokes. Soft, diffused lighting emphasizes volume and paint texture. Sharp frontal shot, square format, maximum detail, all elements in focus.

Генерация осуществлялась в Midjourney 7.0, Nano Banana Pro, Grok и Sora 2.

Полученные результаты подверглись анализу на Python с применением следующих методов:

Box-Counting для вычисления фрактальной размерности D,
MF-DFA для оценки ширины мультифрактального спектра Δα,
формула Шеннона H для определения энтропии,
FFT-анализ для оценки анизотропности.

Итоги эксперимента

Изображение	Фрактальная размерность	Мультифрактальный спектр	Энтропия	Анизотропия
Оригинал	1,80	0,94	7,2	0,38
Grok	1,85	0,88	7,6	0,11
Midjourney 7.0	1,72	0,79	8,1	0,14
Nano Banana Pro	1,46	0,32	5,4	0,45
Sora 2	1,64	0,58	6,5	0,19

Анализ данных

Исследования в области нейроэстетики, проведенные Ричардом Тейлором, подтверждают: человеческая зрительная кора наиболее комфортно воспринимает фрактальную размерность в узком диапазоне 1,3–1,5. В эти границы попадают многие природные формы: очертания горных хребтов, речные русла или геометрия наших сосудов. При созерцании таких паттернов мозг переходит в «энергосберегающий» режим: нарастают альфа-ритмы, снижается уровень кортизола, а орбитофронтальная кора транслирует чувство безопасности. Это не просто вкусовое предпочтение, а физиологический комфорт, который ученые называют «фрактальной беглостью».

Способны ли нейросети создавать настоящее искусство? — Пол Джексон Поллок, Композиция №5

Оригинал, выступающий эталоном, выходит за эти рамки и, теоретически, должен вызывать напряжение. Однако этого не случается благодаря высокой мультифрактальности, которая компенсирует визуальную насыщенность. Мозг адаптировался к обработке такой неоднородности, если она сохраняет статистическое самоподобие. Широкий спектр позволяет коре плавно переключаться между уровнями иерархии без когнитивного диссонанса. Это порождает «фрактальный поток»: несмотря на размерность выше 1,5, мозг считывает структуру как естественную и динамичную. Анизотропность же привносит вектор, созвучный ощущению гравитации, что придает восприятию устойчивость.

Работа от Nano Banana с размерностью 1,46 идеально попадает в эволюционный оптимум. Тем не менее, она проигрывает другим имитациям. Вероятно, дело в том, что при всей математической близости к природным структурам (вроде разреженного леса или облачного неба), узкий мультифрактальный спектр и низкая энтропия делают картину излишне монотонной. Природе свойственна микродетализация — фактура коры, шероховатость листвы. Отсутствие подобных нюансов делает изображение «скучным» для восприятия. Мозг быстро распознает паттерн, успокаивается, но не получает дофаминового вознаграждения за новизну, и интерес угасает.

Имитация от Sora слегка выходит за границы природного оптимума. Средние показатели спектра и энтропии создают эффект «обогащенной среды»: мозг фиксирует детали, но не тонет в избыточности. Это активирует исследовательский азарт. Мы находимся на границе фрактальной беглости, где легкое напряжение сменяется удовлетворением от «разгадывания» композиции. Состояние сопоставимо с созерцанием сложного ландшафта, например, осеннего леса — хаос здесь обладает статистической логикой.

Вариант Midjourney 7.0 с размерностью 1,72 и пиковой энтропией пересекает порог эволюционной толерантности. На мой взгляд, это наиболее убедительная имитация, которую я — стыдно признаться — нахожу более привлекательной, чем оригинал. С точки зрения нейробиологии, реакция оправдана: мозг, привыкший к диапазону 1,3–1,5, считывает такую плотность как аномалию. Высокая энтропия перегружает зрительную кору. Активируется норадреналиновая система, учащается сердцебиение, включается ориентировочный рефлекс. Однако узкий мультифрактальный спектр (0,79) не дает достаточной иерархической базы для выстраивания модели. Возникает не эстетический восторг, а своего рода когнитивный шум. Картина действует как стробоскоп — привлекает, но утомляет.

Абстракция от Grok, с нейроэстетической точки зрения, наименее удачна. Плотность визуальных данных здесь превышает возможности коры по интеграции. Возникает конфликт: мозг ищет знакомый паттерн 1,3–1,5, но не находит его, что фиксируется как когнитивное напряжение. Высокая энтропия лишь усиливает этот эффект, лишая взгляд точек опоры. Это уже не фрактальная беглость, а перегрузка. Физиологически это выражается в стрессовой реакции. Такие паттерны для человеческой психики редки и часто ассоциируются с хаотичной, потенциально небезопасной средой.

Даже если вы не согласны с моими нейроэстетическими выводами, два наблюдения кажутся мне принципиально важными. Во-первых, текущие нейросети пока не способны полноценно и симметрично имитировать сложную абстракцию без специальных манипуляций. Во-вторых, достигнутый уровень имитации уже крайне высок, и в скором будущем ИИ станет серьезным конкурентом художникам-абстракционистам. Субъективно же, пальму первенства в создании таких работ я отдаю Midjourney и Sora.

Источник

Способны ли нейросети создавать настоящее искусство?

Итоги эксперимента

Читайте также

Паблик ВКонтакте

Последние посты