AuraFlow — крупнейшая и полностью открытая модель генерации изображений по текстовому описанию, основанная на технологии потоковых моделей (flow-based models).
Модель достигает передовых результатов по метрике GenEval и представляет собой значительный шаг вперед в области открытых моделей ИИ для генерации изображений.
Эта модель поддерживается командой FAL. Демо доступно на платформе HuggingFace здесь.
Вы также можете построить несколько крутых рабочих процессов Comfy, загрузив модель весов со страницы HuggingFace.
Ещё мы сделали для вас простую удобную портативную версию с установкой в один клик, если вы хотите локально и без костылей насладиться AuraFlow.
Перед установкой отключите антивирус, он ругается на самораспаковывающийся архив. Если переживаете, то скачивайте ZIP-архив, который нужно просто разархивировать в любое удобное место.
«ИИ с открытым исходным кодом находится под угрозой. Когда интерес сообщества к моделям ИИ резко возрос за последний год, мы заметили, что разработка новых основополагающих моделей с открытым исходным кодом прекратилась. Некоторые даже смело заявляли, что ИИ с открытым исходным кодом мертв. Не так быстро!» — пишут разработчики.
Подробнее о технических деталях вы можете почитать в блоге, в этой же статье мы посмотрим на возможности и функции нейросети.
AuraFlow — универсальная модель, которая отлично справляется с позиционированием, текстом и различными стилями. Среди основных её возможностей:
- Высококачественная генерация изображений по текстовому описанию
- Улучшенное следование промпту и пониманию инструкций
- Возможность создания сложных и детализированных сцен
- Открытый исходный код, позволяющий дальнейшие исследования и улучшения
- Разрешение генерации: 1024×1024
Среди настраиваемых параметров доступны следующие:
Окно «Prompt» — Окно для ввода текстового запроса
Окно «Negative prompt» — Окно для ввода негативного запроса (то, чего не хотим видеть на изображении)
Seed — Начальное значение шума. Randomize seed — значение шума выбирается случайным образом.
Width и Height — Ширина и Высота изображения.
Guidance Scale — Параметр определяет то, насколько сильно нейросеть будет следовать текстовому запросу. Рекомендую оставлять значение по умолчанию или в пределах 3.5 — 5
Number of inference steps — Количество шагов очистки от первоначального шума.
Давайте посмотрим на её возможности наглядно.
Начнём с простых запросов:
Prompt: A photo of a grey british shorthair cat
Prompt: an orange cat on a sunny thai beach
Сгенерируем фото девушки с лавандовыми волосами:
Prompt: Photo of a young beautiful lady with long lavender hair
На онлайн-демо есть ограничение по количеству генераций. Чтобы обойти это, достаточно включить VPN.
Посмотрим, как модель работает с текстом и персонажами:
Prompt: astronaut in the ocean, detailed, rgb, 8k,
Добавим ему табличку в руки:
Prompt: astronaut in the ocean holding a sign with «FOOOCUS» text, detailed, rgb, 8k,
Prompt: beautiful anime girl with black hair buns holding a sign with the text «WONDER», smiling, closed eyes,
Prompt: sonic holding a big sign with text «HELLO»
Попробуем отобразить что-нибудь необычное из еды, и начнём усложнять промпты:
Prompt: (medium full shot) of a cake made of colorful skulls, a sophisticated private club, offering elegant decor, refined furnishings, subdued lighting, and a classy ambiance ,Masterpiece,best quality, photo, realistic, very aesthetic
Prompt: bull cow (made of wagyu), wearing white chef hat, wearing white chef uniform, arms crossed, cinematic movie poster, dark black background, professional photography, dramatic shadows, aura, (fine wisps of smoke:0.8), detailed,
Prompt: hyperrealistic majestic giraffe-like creature with a unique and vibrant appearance. The animal has a stunning coat of white fur adorned with bright orange spots, giving it a striking and exotic look. Its eyes are a captivating fiery orange, radiating an intense and mesmerizing gaze. The creature is portrayed lying down with its front paws crossed, emanating a sense of calm and poise. The fur texture is rendered in intricate detail, creating a lifelike and three-dimensional effect. The background is dark, which contrasts beautifully with the bright and vivid colors of the creature, emphasizing its regal and majestic presence
Попробуем сгенерировать что-то из предоставленных примеров:
Prompt: An abstract and vibrant portrait of a woman’s face, where her eyes, nose, and lips are depicted with a swirl of colors, blending seamlessly within the silhouette. The intricate details are accentuated by the landscape of a night forest filled with fireflies, creating an ethereal and dreamlike atmosphere. The background is a mesmerizing mix of pink, purples, and touches of red, green, and yellow, evoking a dynamic and chaotic environment. The artwork exudes intense emotion and passion, drawing the viewer into its captivating world of dark fantasy and artistic expression., illustration, vibrant, painting, dark fantasy, wildlife photography, graffiti, conceptual art
AuraFlow демонстрирует потрясающие возможности в области генерации изображений, и её определенно стоит попробовать!
Подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!