论文部分内容阅读
随着近年来影视制作、虚拟现实、三维打印、自动驾驶、智能医疗等产业的发展,三维模型的需求出现爆发式增长,传统的手动建模方法远远无法满足这一需求,准确高效的三维重建方法成为解决这一问题的关键。被动式三维重建方法通过特征匹配或模板适应的方式从图像或视频中恢复三维模型,然而由于图像和视频中的结构特征具有稀疏性和歧义性,传统方法难以精确、鲁棒地重建出三维模型。先验知识的引入为三维重建问题提供了有力约束,显著提升了三维重建方法的精度和鲁棒性。本文围绕先验信息在三维重建方法中的应用展开研究,提出了复杂先验驱动的三维重建方法。传统先验反映较为较为泛化的特征,如平滑先验、轮廓先验等。与之相对的复杂先验反映更为抽象和针对性的信息,如限定目标为人体、人脸、建筑等具有深层一致性特征的对象。复杂先验信息的运用能够提高三维重建算法的精度、速度和鲁棒性。近年来,深度学习方法的发展使得复杂先验能够以数据驱动的方式自动获取,进一步提升了三维重建方法的最高精度。本文的主要研究工作和创新点包括:1.提出了一种鲁棒的单目视频室外人体三维重建方法。该方法结合代价空间方法和深度优化方法,通过一段视频重建出完整的人体模型。该方法对目标人体抖动具有较高的耐受性。在点云融合阶段,该方法将自动检测出冲突区域,并用迭代的方式对多视点点云进行调整,使得点云收敛成为封闭面片结构。该方法在多视点重建框架中融合多元先验信息,有效降低了室外场景中人体三维重建的误差。2.提出了一种分层预测网格变形的框架,从单张图像重建精细人体模型的方法。该方法结合了参数化预测方法和自由网格变形方法的优点,提出了逐层反馈的结构,每一层以输入图像和上一层投影结果作为输入,采用一个卷积神经网络在二维空间中预测三维模型的外形变化。通过定义不同层级的操控点,将外形变化分成姿态级别、锚点级别和顶点级别三个层次,并采用拉普拉斯网格变形的框架对三维对象进行优化。实验证明本方法提升了重建三维模型的精度,在WILD数据集的评估中相比已有的最优方法有近20%的精度提升。3.提出了一种面向人体的虚拟视点图像生成方法。在已有的光流变形预测网络的基础上,该方法提出了引入三维外形信息作为中间预测,从而将原有的光流预测问题解析成两部分:三维外形预测与光流优化。该方法将包含人体姿态变化的解空间分解成为两个小型子空间,使整个神经网络更为高效地记忆和解释新视点图像化成问题。实验表明卷积神经网络难以精确拟合逐像素的投影和逆投影运算,为此该方法引入投影层为光流预测和外形预测之间建立了高效的转换通道。该方法提升了虚拟图像的估计精度,在PVHM数据集的测试中有约15%的精度提升。上述理论和方法在通过视频、单视图的人体三维重建以及新视点虚拟图像生成问题上取得重要进展。在应用系统方面,本研究设计和实现了高精度面部三维重建系统,该系统结合多种先验对面部进行精细的三维建模,己被应用于真人动画电影的拍摄。本研究设计和实现了单相机转台三维重建系统,在保证高精度的同时降低了硬件成本,该系统已被应用于文物的数字化重建和展示。