论文部分内容阅读
近年来,随着计算机视觉的发展,人脸特征点定位的应用越来越多,如刷脸解锁、视频特效互动、人脸3D动画重建等。但由于现实场景多变,人脸特征点定位这一任务仍没有得到完全解决。二维图片的人脸特征点主要分为2D特征点和3DA-2D特征点(3D特征点在2D平面的投影)定位,前者主要用于人脸轮廓信息的表达;后者更偏向三维人脸形状的描述。很明显,两种特征点在不同的场景有着不同的应用。本文基于级联回归方法,研究了2D特征点和3DA-2D特征点间的跨维度快速转换技术,提供了一种实现多场景间特征点关联的解决方案。首先,考虑到人脸尺度是影响人脸对齐的一个因素,本文提出了一种人脸尺度自适应对齐的方法,不仅实现人脸尺度自适应变换还避免了人脸图片归一化的处理。然后,针对传统级联回归方法面向海量数据的不可学习性以及噪音敏感性,提出一种随机小批量级联回归方法(Mini-Batch Cascade Regression,MBCR),相比于传统级联回归方法,MBCR不仅实现模型基于海量数据的在线学习及微调,而且对噪音具有更好的鲁棒性。接着,考虑到人脸形状的初始化对2D特征点定位有很大的影响,于是本文提出一种能自适应不同人脸检测框的初始人脸形状生成方法,实现初始人脸形状的稳定不变。随后,为探究多场景间特征点的相关联系,本文研究了2D特征点和3DA-2D特征点间的快速互换,这里称为跨维度标注点转换(Cross-Dimension Annotations Conversion,CDAC)技术。在本文的研究中,2D特征点定位和CDAC都是基于前述提出的MBCR方法实现的。最后,通过实验结果表明,MBCR方法在2D和3DA-2D特征点定位精度上优于当前主流算法。2D特征点和3DA-2D特征点间变换算法CDAC可以在3.4GHz的CPU上获得110fps的速度。