В начале апреля среди разработчиков и пользователей платформы X началось активное обсуждение новой функциональности Grok Imagine — системы Speak to Create Images.
Это нововведение позволяет взаимодействовать с нейросетью с помощью голоса, полностью заменяя ручной ввод текста. Grok самостоятельно трансформирует устную речь в детальный текстовый запрос и мгновенно генерирует на его основе высококачественные изображения или видеоролики через инструменты Grok Imagine.

Визуализация Grok
Илон Маск так прокомментировал это обновление: «Голосовое управление в Grok Imagine станет отличным подспорьем для детей. Они обладают невероятной фантазией и уже умеют говорить, но им еще трудно формулировать и записывать сложные инструкции самостоятельно».
Grok Imagine представляет собой продвинутую систему генерации медиаконтента от xAI, встроенную в интерфейс Grok. Релиз инструмента состоялся в 2025 году; он позволяет создавать реалистичную графику и короткие видео (длительностью до 10–15 секунд со звуком), используя текстовые описания или загруженные пользователем референсные снимки.
Сам Grok — это интеллектуальный чат-бот на базе ИИ, разработанный компанией xAI Илона Маска и интегрированный в социальную сеть X. Его ключевыми отличиями являются доступ к данным в режиме реального времени, специфическое чувство юмора и готовность отвечать на провокационные вопросы, которые обычно блокируются другими ИИ-сервисами.
Источник: iXBT
_large.png)

