На YouTube теперь есть более миллиарда видео с автоматически созданными субтитрами

Google объявила о том, что на YouTube теперь загружено более одного миллиарда видеороликов с автоматически созданными субтитрами. При этом отмечается, что эти видео действительно популярны — пользователи просматривают их более 15 миллионов раз за день.

Наличие субтитров очень важно для более чем 300 миллионов людей, имеющих проблемы со слухом. Однако также это является большим плюсом для тех, кто хочет не слушать, а читать — например, когда качество звука оставляет желать лучшего, в помещении слишком громко, человек на видео говорит очень невнятно или зритель изучает иностранный язык.

Субтитры к видео появились на YouTube в сентябре 2006 года, а автоматически создаваемые субтитры — в ноябре 2009 года. Таким образом, на оснащение видеороликов автоматическими субтитрами ушло более семи лет. Стоит учитывать, что функция пока ещё далека от идеала — из-за таких нюансов как неправильное произношение, акценты, диалекты и фоновые шумы её приходится постоянно дорабатывать.

Сравнение старой и новой моделей создания автоматических субтитров

Сравнение старой и новой моделей создания автоматических субтитров

Если учесть, как много контента присутствует на YouTube и насколько он разнообразный, работу компания проделывает очень серьёзную. Улучшая технологии распознавания речи и алгоритмы машинного обучения, а также увеличивая объём данных для обучения, разработчикам удалось повысить точность автоматически создаваемых английских субтитров на 50 %. Компания добавила, что точность создания алгоритмами английских субтитров становится всё ближе к человеческому показателю.

YouTube хочет, чтобы со временем то же самое можно было сказать и об остальных девяти поддерживаемых языках — русском, голландском, французском, немецком, итальянском, японском, корейском, португальском и испанском. Впрочем, это возможно только при участии авторов видеороликов и зрителей.

Источник:

google, youtube, машинное обучение, субтитры

Читайте также