(录用定稿)网络首发时间:2019-12-09 10:23:10

唇读,也称视觉语言识别,旨在通过说话者嘴唇运动的视觉信息,解码出其所说文本内容.唇读是计算机视觉和模式识别领域的一个重要问题,在公共安防、医疗、国防军事和影视娱乐等领域有着广泛的应用价值.近年来,深度学习技术极大地推动了唇读研究进展.本文首先阐述了唇读研究的内容和意义,并深入剖析了唇读研究面临的难点与挑战;然后介绍了目前唇读研究的现状与发展水平,对近期主流唇读方法进行了梳理、归类和评述,包括传统方法和近期的基于深度学习的方法;最后,探讨唇读研究潜在的问题和可能的研究方向.以期引起大家对唇读问题的关注与兴趣,并推动与此相关问题的研究进展.

国家自然科学基金(61872379)资助;

唇读; 视觉语言识别; 时空特征提取; 计算机视觉; 深度学习;

10.16383/j.aas.c190531

TP18;TP391.41

中国知网独家网络首发,未经许可,禁止转载、摘编。

自动化学报

Acta Automatica Sinica

ISSN:0254-4156

中文核心期刊

58281644K
在线咨询 用户反馈