Генеральный директор Google Сандар Пичаи (Sundar Pichai) сообщил, что частота ошибочных слов технологии распознавания речи компании снизилась до 4,9 %. Другими словами, Google расшифровывает неправильно каждое 20 слово. В 2013 году показатель составлял 23 %, два года назад во время конференции I/O 2015 — 8 %.
Пичаи сообщил о достижении в рамках I/O 2017, на которой компания уделила огромное внимание искусственному интеллекту. Для достижения высокой точности распознавания речи Google использует технологии глубокого обучения.
«Мы используем голос как средство ввода во многих наших продуктах, — сказал Пичаи. — Всё потому, что компьютеры стали гораздо лучше понимать речь. У нас было несколько значительных достижений, но с прошлого года темп роста был удивительным. Наша частота ошибочных слов продолжает улучшаться даже в очень шумных местах. Поэтому мы можем точно захватывать ваш голос, когда вы говорите с Google через ваш телефон или Google Home».
В октябре 2016 года Microsoft сообщила, что достигла паритета с человеком в плане машинного распознавания речи. Тогда её уровень ошибок в распознавании слов составил 5,9 %. Неясно, производят ли обе компании оценку по одним и тем же стандартам.
В начале года Google рассказала, что её частота ошибок в распознавании речи с 2012 года сократилась более чем на 30 %. По словам компании, этому поспособствовало активное использование нейронных сетей.
Пичаи поделился интересной подробностью разработки «умной» колонки компании. «Когда мы готовились к поставкам Google Home, то сначала планировали добавить восемь микрофонов, — рассказал генеральный директор. — Но благодаря нейронным сетям и использованию технологии под названием “нейронное формирование луча” мы смогли выпустить её всего с двумя микрофонами и достичь того же качества».
Источник: 3DNews