计算机唇读系统的研究与实践

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhangtao707382332
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对计算机唇读的研究在语音识别、人机智能接口、多媒体系统以及人脸数据压缩等领域具有重要的理论意义和实用价值.该文搭建了一个基本的唇读识别系统,对唇读的基本技术问题包括实时唇动检测、唇动定位与特征提取、唇读识别和唇读融合进行了研究和实践,并建立了适合进行中国唇读研究的双模态语料库CAVDatabase.具体包括以下研究内容:在唇的检测方面,对传统唇色模型进行了改进,提出了自适应色度滤波模型.在唇动定位与特征提取方面,通过自适应色度滤波技术对唇色进行增强处理,解决了可变模板方法的难点问题,即对图像质量的高度依赖,使得唇的定位与特征提取更加准确.在特征提取方面,将基于模板(model-based)和基于图像的(image-based)方法相结合,取长补短,有效地得到了唇部的 运动信息.在唇读识别方面,利用半连续HMM模型实现了对82个口型序列图像的训练和识别.对模型在唇读识别应用中的一些具体问题进行了探讨,建立了适合唇读的HMM模型.最终取得了特定人40.2﹪,非特定人30.9﹪的识别率.在唇读融合方面,提出了带先验知识的DS理论,对不同程度的噪声语音可提高识别率10﹪-30﹪.为了进行唇读系统的研究和实验,该文建立了涵盖82个汉语发音适合进行唇读研究的双模态语料库CAVDatabase,为唇读的研究打下了基础.
其他文献
随着数据库技术的发展和应用,社会各部门积累了大量的数据,而且这些数据每一天都在增加。数据挖掘是发现这些数据背后隐藏的知识的有效手段,但是,如果在数据库更新之后都要对全部
该文主要包括如下几个方面:提出了基于BDI框架的多智能体竞争与合作体系,将竞争思想引入智能体的内部思维状态中.此外,讨论了在整个体系中适合于分布式多机器人系统的分组通
该文对基于军事地理信息系统(MGIS)、军用地图处理的空间数据分析和数据挖掘技术进行了研究和探索,详细介绍了基于空间数据分析和数据挖掘的炮兵阵地分析系统的模型、系统结
随着互联网的广泛使用,保护敏感和机密信息的系统的正确性验证日渐成为一个重要的问题。许多保护机密信息的协议使用到了随机机制,用于混淆秘密信息和公开信息之间的联系。典型
该篇论文的工作主要是在于前者,主要阐述了图像的骨架化算法.近年来提出的骨架化算法大多是基于拓扑形状分析方法,该文在总结了已有的骨架化算法的基础上,将计算几何学中的Vo
指挥所选取系统是根据指挥辅助决策系统的需要开发的.该论文详细介绍了指挥所选取系统的组成、功能、实现过程、指挥所选取算法以及微波、超短波电台覆盖分析、点到指定区域
该文首先介绍了一个大型的专利审查系统——国家知识产权局专利局专利审查流程管理系统三期——的开发.在对专利审查系统进行了需求分析的基础上,提取了系统开发过程中需要解
该论文全面介绍了网络监测的基本概念和在局域网中实现网络信息监测和分析的基本原理,并对其相关技术做了简要说明.该文详细讨论了Windows环境下一种用于网络监测的开发包Win
在科研人员的科研活动中,发表论文是其中的一项重要工作。如果选择了不合适的出版物进行投稿,则经过长时间的审稿过程之后会有较大的被退稿的风险,浪费科研人员大量的时间和
流媒体技术改变了网络原有的资料下载方式,引入流的概念对庞大的数据量的视音频信息进行操作,使人们通过网络不必经过漫长地等待就可以看到图像、听到声音,甚至和他人进行实