Компания OpenAI начала предоставлять доступ к усовершенствованному голосовому режиму чат-бота для подписчиков ChatGPT Plus. Как сообщает The Verge, этот функционал впервые показали на презентации GPT-4o в мае 2024 года.
Во время демонстрации выступающие имели возможность перебивать ответы чат-бота, уточнять детали и просить пересказать истории различными голосами, включая драматический стиль, голос робота или даже в форме песни.
Изначально альфа-версия голосового режима планировалась к запуску в конце июня 2024 года, однако сроки были перенесены. Разработчики пояснили, что это связано с необходимостью улучшить способность модели к обнаружению и блокировке определённого контента. В частности, добавили фильтры для запретов на создание музыки или других объектов, защищённых авторским правом.
После презентации пользователи социальных сетей отметили, что голос Sky сильно напоминал голос актрисы Скарлетт Йоханссон и её персонажа из фильма «Она». В ответ на это OpenAI убрала данный голос из использования.
Новый голосовой режим ChatGPT будет поддерживать только четыре голоса, созданных при помощи профессиональных актёров озвучивания. Компания гарантирует, что чат-бот не сможет имитировать голоса других людей. Для всех пользователей ChatGPT Plus доступ к этому режиму откроют осенью 2024 года.