论文部分内容阅读
现在出现了许许多多的语音识别系统,而且也取得了不错的识别效果。但语音识别系统忽略语言的视觉特性,仅仅利用听觉特性,使得语音识别系统在噪声环境下,识别率大大下降。生活经验告诉我们,在人与人交流的过程中,人们在理解他人讲话内容时不仅通过声音来感受信息,而且还用眼睛观察对方口型、表情的变化,视觉信息是对声音信息的有利补充。所以要克服语音识别系统的弱点,利用唇语是一个不错的解决方法。初步的研究表明,将听觉语言与嘴唇视觉信息进行融合能有效地改善识别率,特别在噪声环境下,效果更为明显。所以有必要对唇语进行研究。目前唇语识别的研究主要包括两个方面,基本内容的认知和人物身份的鉴别。现阶段,国内外一些学术机构对唇语的研究主要是基于说话者内容的识别,而对人物身份的鉴别研究相对较少。鉴于此,本文将对基于唇语识别的身份识别进行尝试性研究,着重对表征嘴唇模型所用不同的特征和特征组合进行特征鉴别力分析,以期获得更好的视觉特征来描述嘴唇轮廓。本文首先介绍了唇语识别技术的发展历史和现状,而后根据经典唇语识别系统识别流程,详细介绍了各个流程所涉及的理论背景和关键技术。其中,特征选取与提取的部分是本文研究重点,最后通过分析隐马尔科夫分类器的识别结果作为判别各种特征及特征组合辨别力高低的标准。嘴唇特征的提取是唇语识别系统最为重要的一环,能否选择有效的嘴唇特征来描述嘴唇模型,对整个识别过程起着至关重要的影响,特征类型多种多样,纷繁芜杂,需要通过大量的实验积累和数据分析,才能分辨出不同特征组合鉴别力的优劣和高低。特征的选取取决于特征提取的算法,本文采用的是14点主动形状模型。相应地,我们选择了嘴唇模型的宽,高形状特征,通过曲线拟合得到的参数组合作为几何特征,以及几何和形状特征对应的一阶二阶动态特征,再对这些特征进行不同的组合,通过大量的实验进行特征辨别力分析。实验结果表明,本文所取特征均为有效特征,能够达到一定的识别率,但与国外的研究结果还有一定差距,所以个人还有更多的工作要做,还有更长的路要走。