基于AdaBoost的唇读方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:greenbrowser
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在基于句子级唇读识别的基础上,对唇读的基本技术问题包括预处理、唇动定位与特征提取、特征优化、唇读识别进行了研究和实践,具体包括以下内容:首先介绍了包含200个常用汉语句子的双模态语料库CAVDatabaseⅡ.通过对人脸区域的实时分析,自适应的找到唇色与肤色的聚类范围,从而修正唇色模型,利用该模型实现了实时唇动检测与跟踪.在唇的定位与特征提取方面,结合自适应色度滤波技术,利用可变模板定位唇,提取唇的形状特征,通过K L变换提取唇的图像特征,将两部分特征相结合.在特征优化方面,利用直接挑选法得到局部最优特征.通过适当减小形状特征权值,缩小了形状特征较不准确对识别造成的影响.通过对特征值进行规整,有效的改善了不同维特征的特征值分布差异较大的状况,并比较了是否包含形状特征的规整方法,使各维特征的结合更加有效.在唇读识别方面,利用以HMM为弱分类器的AdaBoost的唇读识别方法,有效地解决了样本空间的交叠问题,通过强化训练那些难以分类的样本,使得识别性能有所提高.
其他文献
本文在分析当代商业网络处理器体系结构特征的基础上,首先按照网络处理器市场、网络处理平面的不同定位对商业网络处理器产品进行分类,并据此展望了下一代网络处理器的设计趋
本文设计了基于预分配密钥信息思想的安全通信协议,该协议由密钥管理功能模块和加解密模块组成,二者协同工作,实现了数据的安全加密传输。 建立对称密钥是传感器网络安全问
工作流技术是近年来计算机应用研究领域中迅速发展的一项新技术,作为工作流技术的实现,工作流管理系统已广泛应用于众多行业中。其中,工作流管理系统的最重要功能之一就是工
电磁声发射无损检测技术是近些年来新兴的一种无损检测技术。目前还处于实验室阶段,实验过程中由于采集到的电磁声发射信号中不可避免地存在噪声干扰的问题,为了提高电磁声发射
非均匀有理B样条(Non-Uniform Rational B-spline,简称NURBS)方法,是计算机辅助设计(CAGD)中表示和处理曲线曲面几何问题的一项重要标准。因为NURBS优良的性质,使它成为工业界对
本文分析和利用超链接信息,即利用对链接文本和标题、所指向网页内容分析来对该链接文本(亦即对链接所指向的网页)进行分类并进行错标、漏标识别。本文首要提出网页中的链
本文首先在分析程序的网络接口的基础上,提出“两步生成,同步精化”的用例自动生成模型,并根据此模型设计和实现了基于网络接口的健壮性测试平台——NORTS。测试用例的
近年来随着分布式虚拟环境系统的广泛使用,对系统的交互性、实时性、真实感的要求越来越高,网络带宽和延迟成为了分布式虚拟环境的主要限制。由于分布式虚拟环境广泛采用三维
“试验”系列卫星计算平台的仿真研究是本课题的背景,通过建立面向卫星计算平台的软件仿真环境,可以有效解决卫星计算平台的测试问题,并可对卫星计算平台的研发起到加快
本文以中间件技术为依托,在中间件技术中关系数据转换到XML数据输出的构架的基础上,提出了一个关系数据转换成XML输出的中间数据转换模型VTree.不同于其他中间件中的数据转换