论文部分内容阅读
对普通场景视频进行人脸识别时,会受到视频抖动、光照、姿态、表情等等因素的影响,其中光照变化对人脸识别系统的影响非常显著;视频抖动对图像的后续处理以及人工观察十分不利,因此本文对普通场景视频在光照变化条件下的视频稳像、人脸检测,人脸特征提取以及分类器设计等关键问题进行了深入研究。论文的主要内容如下:第一章阐述了人脸识别研究的背景、意义和目的,并分析了人脸识别中难点和挑战;同时详细论述了视频稳像以及可变光照条件下人脸识别研究和应用的现状以及发展趋势,并针对视频人脸识别的视频稳像以及光照问题,给出了本课题的研究内容和思路。第二章论述了人脸识别的一般过程,并针对普通场景视频人脸识别的关键技术进行了详细剖析,为后续研究提供了理论基础。第三章研究了视频稳像算法与视频人脸图像稳定获取。在基于旋转平移运动模型和均值滤波的传统稳像算法基础上,提出了基于运动成像模型和自适应均值运动滤波算法的稳像算法,并将其应用于视频人脸图像稳定获取。运动成像模型是将扫描运动和旋转平移模型融合在一起而构成的运动模型,实现了消除快速扫描运动的影响。同时为了满足运动成像模型对局部运动点的对称性要求,采用了块的二阶矩估计局部运动。自适应步长均值运动滤波方法实现了自动判断抖动过程是否结束,并在抖动结束后用均值滤波方法分离出抖动运动矢量。实验结果表明,所提出的算法能在存在快速扫描运动情况下有效实现视频稳像,实现了视频人脸图像稳定获取。第四章对Adaboost算法的应用进行了深入研究。利用Adaboost算法和Haar-like特征实现了视频或图片中人脸的检测,并采用人眼区域和人脸区域的空间约束关系实现假人脸区域的消除。第五章提出了基于滤波和LBP人脸高阶光照不变特征提取方法。针对用滤波方法提取的人脸特征受到较严重光照影响以及与滤波参数有关的问题,采用LBP编码滤波特征以获得人脸高阶特征,从而减少上述两个因素对特征的影响,同时低通滤波能够降低图像的噪声,使得高阶特征对噪声具有鲁棒性。实验结果表明,所提出的特征提取方法更能适应光照条件的变化。第六章提出了基于非局部NeighShrink滤波的降维光照不变特征提取方法。该算法将非局部均值滤波思想融入NeighShrink模型,使获得的非局部NeighShrink模型对光照的自适应能力更强;同时把数据融合技术和小波分析结合在一起,实现提取人脸的降维全信息特征。实验结果证明,所提出的算法能更好地适应光照条件的变化,以及降低后续计算所需的资源和时间。第七章提出了基于改进的多数投票法多分类器集成,并对集成系统多样性进行了研究。改进的多数投票法用混淆矩阵估计成员分类器把输入分到某一类的概率,实现了多分类器集成在多类分类问题上性能的提升。同时针对传统集成系统多样性度量的不足,提出了基于Shapley值的多样性度量方法。该方法实现了多样性描述和分类结果的关联。实验结果证明改进的多数投票法在多类分类问题上优于多数投票法,以及所提出的多样性度量方法能较好地衡量集成系统的多样性。第八章搭建了视频图像人脸识别控制系统平台。该平台实现了人脸的自动检测、特征提取与识别功能,并针对抖动视频设置了稳像功能,为以后的研究和应用奠定了基础。第九章对全文进行了总结。论述了本课题研究的内容、结论以及创新点,同时对后续研究工作作出了展望。