В Оксфорде создали программу, читающую по губам лучше людей-профессионалов

Мар 20, 2017, 18:45
В Оксфорде создали программу, читающую по губам лучше людей-профессионалов

Оксфордским учёным в процессе научной работы удалось создать специальную программу, которая профессионально читает по губам. Сообщение об этом появилось на сайте университета накануне. Программа под название Watch, Attend and Spell (WAS), основана на работе распознавания образов и машинного обучения. Перед началом работы ей показали не менее 5-ти тыс. часов телепрограмм. За этот период времени ведущие произнесли не менее 118 тыс. предложений с общим словарем в 17500 слов. В итоге ученые обнаружили, что новое программное обеспечение было не менее точным в сравнении с специалистом.

Исследовательская группа сравнивала способности машины и человека-эксперта разбираться в том, что говорилось в видео, сосредоточившись только на движениях губ людей в эпизоде.

«Чтение по губам является впечатляющим и нелегким мастерством, и мы можем рассчитывать, что наша работа найдет огромное количество иных приложений, таковых как диктовка инструкций по телефону в шумной обстановке, перезапись архивных немых фильмов и поднятия эффективности автоматизированного распознавания речи в общем, добавил соавтор разработки Joon Son Chung». Ученые посоветовали и некоторые иные варианты применения программы: озвучивание немых фильмов, распознавание речи нескольких людей одновременно, и давать указания телефону в шумной атмосфере.

Вам может понравиться