Компания Stability AI объявила о запуске обновленной версии своей языковой модели под названием Stable Diffusion 3 Medium, описываемой разработчиками как «самая продвинутая открытая система для генерации изображений».
Обладая 2 миллиардами параметров, эта модель способна создавать изображения высокого качества и работает на обычных потребительских видеокартах с минимальным объемом памяти в 5 ГБ, хотя для наилучшей производительности рекомендуется 16 ГБ.
Одним из главных улучшений новой версии является повышенное качество генерации изображений лиц и рук, а также усовершенствованные возможности в области типографики и обработки текстовых запросов. Это позволяет SD3 Medium точно интерпретировать сложные текстовые описания и реалистично воспроизводить пространственное расположение элементов в сцене. Улучшения в архитектуре Diffusion Transformer обеспечивают более детализированные изображения на уровне мегапикселей.
Stability AI утверждает, что новая модель Stable Diffusion 3 Medium предназначена для работы на стандартных видеокартах, благодаря чему она становится доступной для широкого круга пользователей. Компания подтверждает свои намерения продолжать улучшать функциональность и производительность модели.
Пользователи могут начать тестирование SD3 Medium через API Stability или на сервере Stable Artisan в Discord, чтобы опробовать новые возможности модели на практике.