论文部分内容阅读
生物识别技术因其独特性及便捷性在日常生活中受到大家的青睐。唇动身份认证技术是一种综合个体生理特征与发音习惯的新识别技术,两者的结合使得该技术的独特性表现较好,而且对用户的要求相对较低并且很难被伪造。本文的研究目的即为根据说话过程中的唇部变化识别特定说话者身份。唇部数据库是整个研究的基础。本文综合分析了国内外现有的静态人脸数据库和双模态语料数据库,将CAS-PEAL数据库中的800张人脸图片经唇部分割输出唇部图片与ORL数据库中的800张非唇部图片组成静态唇部数据库。同时参考双模态语料库的构建方法自建了小型的语料数据库。考虑到数据库拍摄角度是对准人脸,本文设计唇部定位的流程是人脸定位、唇部粗定位、唇部细定位。人脸定位采用的是基于Haar特征的Adaboost算法,此方法识别效果及实时性均表现良好。唇部粗定位是在人脸识别的基础上根据五官分布规则分割得到,细定位的设计流程是阈值分割、开运算、填充连通域及平滑滤波,实验效果证明无论唇部是闭合或张开状态均能定位准确。针对视频转化为静态图片数据量过大的问题,本文提出了改进的代表图片序列选取方法。根据唇部轮廓特征确定首尾两端,然后根据基于最大灰度变化的帧间差分法选取代表图片。实验证明此方法很有成效,可以达到精炼数据库的目的。考虑到人脸定位及唇部定位尚不能达到百分百的准确率,本文设计了基于唇部特征与神经网络的模式识别方法,并比较了Hu矩特征、GLCM(Gray Level Co-occurrence Matrix)特征和GGCM(Gray-Gradient Co-occurrence Matrix)的识别效果。本文提出基于PCA(Principal Component Analysis)的特定人唇部识别,建立特征唇空间,通过度量实验样本投影到特征唇空间的向量与训练样本之间的距离识别身份。此外,为了增强系统的灵活性,提出将唇部特征以二维码的形式储存起到共享密码,授权的作用。然后,本文设计了基于SURF(Speed Up Robust Features)的特定人唇语识别,通过改进的特征点匹配方法,根据序列间两两图片的匹配点总数识别说话内容。实验证明此方法表现良好。