xAI Илона Маска представила Grok Speech to Text: поддержка 25 языков и самая низкая цена на рынке

Инструмент стал доступен широкому кругу пользователей

18 апреля 2026 года корпорация xAI открыла публичный доступ к своему API для распознавания речи Grok Speech to Text (STT). Сервис обеспечивает качественную транскрипцию аудиоматериалов на 25 языках, включая русский.

В число функциональных преимуществ входят детализированная привязка текста к таймкодам, поддержка многоканальных аудиозаписей, а также интеллектуальная идентификация и разделение голосов разных спикеров.

По утверждению представителей xAI, новый продукт сочетает в себе исключительную точность и наиболее выгодные тарифы в индустрии:

  • Обработка файлов: $0,1 за час записи;
  • Транскрибация в реальном времени: $0,2 за час записи.

xAI Илона Маска представила Grok Speech to Text: поддержка 25 языков и самая низкая цена на рынке

Визуализация Grok

Данное решение упрощает для разработчиков процесс внедрения передовых технологий распознавания речи в собственные приложения. Этот шаг является частью глобального плана xAI по масштабированию экосистемы Grok.

Аналогичные алгоритмы уже успешно функционируют в голосовом помощнике Grok Voice, бортовых системах автомобилей Tesla и поддержке пользователей Starlink. Теперь же эта мощная технологическая база впервые доступна сторонним компаниям.

Напомним, что ранее команда Илона Маска анонсировала выпуск API для синтеза речи (Text-to-Speech), способного преобразовывать печатный текст в естественное звучание с глубокой эмоциональной окраской.

 

Источник: iXBT

Читайте также