На YouTube теперь есть более миллиарда видео с автоматически созданными субтитрами

Google объявила о том, что на YouTube теперь загружено более одного миллиарда видеороликов с автоматически созданными субтитрами. При этом отмечается, что эти видео действительно популярны — пользователи просматривают их более 15 миллионов раз за день.

На YouTube теперь есть более миллиарда видео с автоматически созданными субтитрами

Наличие субтитров очень важно для более чем 300 миллионов людей, имеющих проблемы со слухом. Однако также это является большим плюсом для тех, кто хочет не слушать, а читать — например, когда качество звука оставляет желать лучшего, в помещении слишком громко, человек на видео говорит очень невнятно или зритель изучает иностранный язык.

Субтитры к видео появились на YouTube в сентябре 2006 года, а автоматически создаваемые субтитры — в ноябре 2009 года. Таким образом, на оснащение видеороликов автоматическими субтитрами ушло более семи лет. Стоит учитывать, что функция пока ещё далека от идеала — из-за таких нюансов как неправильное произношение, акценты, диалекты и фоновые шумы её приходится постоянно дорабатывать.

Сравнение старой и новой моделей создания автоматических субтитров

Сравнение старой и новой моделей создания автоматических субтитров

Если учесть, как много контента присутствует на YouTube и насколько он разнообразный, работу компания проделывает очень серьёзную. Улучшая технологии распознавания речи и алгоритмы машинного обучения, а также увеличивая объём данных для обучения, разработчикам удалось повысить точность автоматически создаваемых английских субтитров на 50 %. Компания добавила, что точность создания алгоритмами английских субтитров становится всё ближе к человеческому показателю.

YouTube хочет, чтобы со временем то же самое можно было сказать и об остальных девяти поддерживаемых языках — русском, голландском, французском, немецком, итальянском, японском, корейском, португальском и испанском. Впрочем, это возможно только при участии авторов видеороликов и зрителей.

Источник:

google, youtube, машинное обучение, субтитры

Читайте также