Компания Meta* представила модель искусственного интеллекта SeamlessM4T, которая может расшифровывать речь и переводит её почти на 100 языках.
Сама компания говорит, что это прорыв в области преобразования речи в речь и речи в текст на базе искусственного интеллекта.
Наша единая модель обеспечивает переводы по требованию, которые позволяют людям, говорящим на разных языках, более эффективно общаться. SeamlessM4T неявно распознает исходные языки без необходимости использования отдельной модели идентификации языка
Судя по последнему предложению, речь о модели ИИ, которая изначально обучена как распознавать язык и преобразовывать его в текст, так и переводить. То есть это не две отдельные модели в одном ПО.
В процессе разработки Meta использовала порядка «десятков миллиардов» предложений и 4 млн часов речи. Кроме того, исследователи сопоставили 443 000 часов речи с текстами и создали 29 000 часов согласований «речь к речи», которые «научили» SeamlessM4T транскрибировать речь в текст, переводить текст, генерировать речь из текста и даже переводить слова, произнесенные на одном языке, на слова на другом языке.
При этом Meta понимает, что её модель не идеальна, поэтому не рекомендует использовать SeamlessM4T для перевода длинных форм и каких-либо документов, например тех, которые признаются государственными учреждениями и органами перевода. Meta также не рекомендует использовать SeamlessM4T в медицинских или юридических целях.
Опробовать работу ИИ можно по этой ссылке.
* Instagram и Facebook принадлежат Meta, которая признана в России экстремистской и запрещена.
Источник: iXBT