论文部分内容阅读
三维人脸重建(人脸建模)是多媒体领域一个极富挑战性的课题,人脸的三维模型在诸多领域都有应用,诸如电话会议、虚拟现实、动画与人脸识别、刑事鉴别等。为了逼真地重建三维入脸,学者们已经尝试了许多途径。这些方法可分为以下几类:基于三维扫描装置的人脸重建、基于形变模型的人脸重建以及基于图像的人脸重建。利用三维扫描装置建立的人脸模型精度较高、数据量也很大,但成本也比较高。基于形变模型的人脸重建方法可以实现人脸自动建模,然而所建立的模型质量高度依赖于形变模型,并不适用于与普通个体差异过大的建模对象。基于图像的人脸重建只需利用摄像机或数码相机获取目标人脸的图像,借助图像信息建立三维人脸模型,成本较低,但通常很难从二维图像中抽取足够的人脸几何信息。
考虑过这些方法的优缺点之后,本论文提出了一个借助网格光从两张二维图像中重建三维人脸的方法。本论文使用的网格光可以增加目标脸部的纹理、便利特征点匹配。为了保护皮肤和眼睛并且降低成本,论文里使用普通白光光源作为投影光源。最终,论文依据双目视觉的原理计算人脸的三维信息,再利用B样条(NURBS)重建三维人脸曲面。本论文主要开展了以下几方面的研究工作:
1.论文提出了一个基于一维标定杆的双目视觉系统的标定方法,该方法依赖六对不同角度的绕一端旋转的标定杆的图像,首先获取相机的内部参数与特征点的三维坐标,然后依据角对应的原理,计算相机之间的外部参数,在论文里还进一步讨论了这种方法必须避免的情况。通过与Zhang的方法的结果对比,并且计算标定杆上三点间距离的比值,证明了该方法简单有效。
2.由于使用普通白光光源作为投影光源,使得投影条纹的质量下降,传统的细化与抽取条纹方法不适应这种情况;为了细化与抽取网格条纹,论文使用了一个新的基于边缘信息的分水岭算法;使用分水岭算法可以精确地抽取条纹,但是分水岭算法容易受背景和噪声的影响,产生过分割现象;论文首先通过预处理减轻噪声与背景信息的影响,然后获取条纹边缘信息,这些边缘信息为合并过分割的小区域提供了很好的参考。由于分水岭线只有一个像素宽,论文可以实现同时进行网格条纹的提取与细化。
3.为了获取网格交叉点的精确的位置、连接关系以及它们的标记,论文提出了一个基于图形连接性的新算法,该算法不需要提出一个包含所有情况的条件集,只需要计算平均点坐标与欧拉距离,然后利用它们提取所有网格交叉点的坐标,再利用补偿算法处理特殊情况;这种算法不需要考虑每一种网格交叉点的可能位置,也避免了遗漏真实的交叉点。
4.为了便利交叉点匹配,网格条纹是以十字轴为基础均匀分布的;在已确定十字轴的中央交叉点之后,十字轴上其它的交叉点和其它条纹的交叉点将以这些交叉点为基础进行标记;在依据同样的原则标记左、右目图像中的交叉点后,建立一个标记集合,这个标记集合和随机抽样一致性算法(RANSAC)使得一个迭代扩张的立体匹配更为精确。
5.重建的人脸模型依据双目视觉的原理计算采样点的三维信息。为了提高系统的精确度,论文使用了一个宽基线的系统,还采取了一些措施来补偿我们的特征点的提取算法所带来的误差。在本论文里,分别利用真实人脸与模型人头重建了一些三维人脸模型,这些模型大都效果逼真;失败的模型则说明了一些重建人脸模型过程中必须注意的问题。