视频中多姿态人脸的特征点定位研究

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:chinayzx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸特征点定位在人脸识别领域有着广泛的应用,是很多人脸识别研究工作的前提条件。近年来,人脸特征点的研究成为一个热点,但是人脸特征点的定位是否准确是人们研究的关键。本文采用ASM算法和L-K光流法相结合,提高了人脸特征点定位精度,实现了视频中多姿态人脸特征点的跟踪定位。主要完成了以下几方面的工作:(1)分析了目前常见的人脸特征点定位算法,并对其进行了分类总结,分别对这些算法的性能进行了比较。基于本文所研究的视频中人脸特征点的跟踪定位,最终选择了基于主动形状模型(ASM)算法用于实验研究。(2)为了解决ASM算法初始位置定位不准确的问题,首先采用Adaboost算法进行人脸检测,即进行人脸的粗定位,找到人脸的大概位置,再用ASM算法进行精确定位。其次,由于ASM模型训练阶段需要耗费大量的人力和时间来进行样本的特征点标定工作,因此本文提出了一种矫正对称模型的方法,提高了算法时间效率。最后,采用图像金字塔的方法对ASM算法的定位精准度做出了改进。(3)为了解决单个ASM模型在多姿态人脸定位中的局限性,本文训练了正面人脸模型,平面外旋转的两个方向的模型对视频中人脸进行定位。但是,ASM模型在视频中进行人脸定位时无法自动判断某个姿态下模型与目标的匹配效果,因此,采用改进的L-K光流法对几个跟踪准确的关键点进行跟踪,并实时计算与模型匹配的特征点之间的平均误差距离,根据误差大小来获取更准确的人脸模型进行匹配。(4)采用仿射变换和偏移矫正的方法对L-K光流法进行了改进,计算出本文所选取的关键特征点在视频相邻帧之间的仿射变换参数,并利用跟踪准确的点的相关变化参数对跟踪不准确的点进行调整,提高了算法跟踪的精确度。然后分别采用改进后的L-K光流法和ASM算法对关键特征点进行跟踪,并对两种算法的跟踪准确度和稳定性进行了比较。(5)将本文所提及的算法应用到多姿态人脸视频中,在VS2010和OpenCV平台下通过对多个ASM模型的自由切换实时定位运动中的人脸进行了相关实验验证,实现了视频中多姿态人脸的特征点定位。
其他文献
该文建立了一个汉法机器翻译系统(CFMT)原型,着重进行汉法语言的比较和法语译文生成,同时也兼做汉语分析部分的内容.该系统主要应用于网络翻译,进一步适用于法律、商业等领域
舌诊是传统中医诊断的方法之一,在医疗诊断中起到了重要的作用.长期以来医生凭肉眼验舌,靠经验辨症,影响了舌诊的应用和发展.该文将图象处理、模式识别、人工智能和计算机等
该文在结合光学字符识别(OCR)技术、机器翻译技术和数码相机技术的基础上,提出一个从视觉到翻译的机器智能系统,为推动机器翻译技术在数字时代的应用和发展作一次尝试.该文在
该文分析了电力电子领域的软开关技术的发展现状;介绍了应用软开关技术,为实现稠油加热而研制的特种变频器,在文中对变频器的设计思路、硬件构成进行了详细的说明.通过分析各
近年来,机器人视觉技术已成为机器人领域一个重要的研究课题,本文在机器人图像处理及智能控制方面做了如下工作: 设计了基于视觉的智能移动机器人导航系统的结构,其中包括移动
控制理论的发展与进步,一方面依赖于工业和其它技术科学提出的越来越高的要求,另一方面与科学技术的发展水平,特别是数学工具的进步密切相关。数学在控制理论中起了重要作用,尤其
身份证件的自动识别属于目标自动识别中的一种.身份证图像上字符的识别属于印刷体识别,是字符识别的一个分支.该文主要讨论了身份证图像自动识别的几个关键技术:身份证图像中
神经网络理论与实现技术是当前控制界最为活跃的前沿研究方向之一.该文以此为工具研究了不确定性完全未知的线性与非线性系统的控制问题,所获结果如下:1.对一类不确定非线性
该论文围绕移动运营商关心的问题入手,结合最新的计算机技术和理论提供一种决策支持系统的解决框架.该解决方案是可实施的,在系统结构上具有可扩展性,稳定性,同时成本和风险
在气象卫星上,微波成像扫描仪是非常重要的酬载,而扫描仪的控制系统是扫描仪上的核心机构,其控制性能将对扫描仪的成像精度和卫星任务的完成情况产生重大影响。无刷直流电机因为