Нейросеть читает по губам 46,8% слов по телевизору, человек — только 12,4%
Кадры четырёх передач, по которым обучалась программа, а также слово «afternoon», произнесённое двумя разными дикторами Две недели назад рассказывалось о нейросети LipNet, которая показала рекордное качество 93,4% распознавания человеческой речи по губам. Уже тогда предполагалось множество применений для такого рода…
Читать дальше