Не так давно Департамент компьютерных наук Оксфордского Университета отсчитался о том, что созданная им нейросеть LipNet способна понимать по губам более 93% слов английского языка в свободной речи и переводить ее в текст. Это, конечно, очень крутой результат. Они же обещали к концу зимы выпустить следующий релиз, но все еще ждем.
Значение и перспективы таких моделей очень велики и использовать их можно практически где угодно, где есть видео-камера. Недаром, наверное, в престижных Европейских футбольных чемпионатах тренера и футболисты при общении прикрывают рты рукой.
Статью, кратко описывающую достижения LipNet можно прочитать здесь (
https://www.technologyreview.com/s/602949/ai-has-beaten-humans-at-lip-reading/) Либо подробно здесь, но это более трудно для понимания (
https://openreview.net/pdf?id=BkjLkSqxg) Хотя, нередко, информация о таких перспективных проектах, после их первых существенных успехах пропадает, как, например, про довольно усешный проект дистанционного чтения мыслей, о котором я писал с месяц назад (
https://t.me/proprofiling/284).
Совпадение? Даже не знаю ????