Google объявила о расширенном доступе к своей новейшей модели преобразования текста в изображение — Imagen 3. Впервые представленная в мае на конференции Google I/O, эта модель теперь доступна широкой аудитории.
Imagen 3 — передовой инструмент на основе искусственного интеллекта от Google, способный конкурировать с другими известными моделями, такими как Midjourney, DALL-E 3 и Grok-2 от X. Однако, в отличие от Grok-2, связанного с созданием изображений, нарушающих авторские права, и дипфейков известных личностей, Google утверждает, что предприняла серьезные меры по фильтрации и маркировке данных, чтобы минимизировать вредоносный контент и снизить вероятность появления нежелательных изображений.
Более того, изображения, созданные с помощью Imagen 3, снабжены цифровым водяным знаком SynthID от Google, что позволяет отслеживать их происхождение. Это важный шаг на пути к повышению безопасности и прозрачности в сфере искусственного интеллекта.
По данным Google, Imagen 3 предлагает большую универсальность и точность в интерпретации подсказок, высокое качество изображений и улучшенную передачу текстовых элементов, что всегда являлось вызовом для моделей ИИ. Пользователи уже тестируют Imagen 3 в реальных условиях и остаются впечатлены его возможностями.
Модель также выделяется своей гибкостью и способностью понимать более сложные подсказки, что позволяет создавать детализированные и реалистичные изображения. В дополнение к этому, Imagen 3 применяет улучшенные алгоритмы для минимизации искажений и шумов в изображениях.
Тем не менее, некоторые пользователи на Reddit выразили недовольство тем, что модель слишком ограничивает виды изображений, которые разрешено генерировать.
Imagen 3 уже доступен через платформы ImageFX и VertexAI. В скором времени генератор будет интегрирован во все функции Google AI в Workspace и Gemini, как в веб-браузере, так и на мобильных устройствах.
Источник: iXBT