论文部分内容阅读
由于游戏、动画等应用的需求,三维人体重建一直是计算机图形学的重要研究课题。近几十年来,研究员们围绕这一课题提出了多种方法,取得了丰硕的成果。由于三维人体模型在游戏、动画中具有较高的应用价值,所以可以容忍这些方法在采集设备、方式和重建效率上付出较高的代价。然而对于虚拟试衣的个人用户来说,这些方法在方便性及快捷性方面存在很多不足:(1)采集设备诸如扫描仪、Kinect,并不是普通用户的常用设备;(2)采集方式要求用户穿紧身衣或穿着很少,给用户带来了不便与尴尬;及(3)迭代优化人体模型使之贴合输入数据的方法非常耗时。本文围绕提升方便性及快捷性两个方面,攻克了一些难点。经过三个阶段性的研究,最终我们仅使用一部安卓手机或平板,拍摄用户正面及侧面两张照片,然后在数秒内便可以获得用户的三维人体。为了便于用户进一步编辑三维人体身材,我们提出了一个参数化的语义身材模型,并基于该模型重建及编辑三维人体身材。具体来说,本文的研究成果总结如下:·我们提出了一种针对着装图像的快速衣服尺码估计方法。着装图像即图像中的人穿着日常衣服,以着装图像作为输入,一方面远离了普通用户很难接触到的扫描仪或深度感知设备,另一方面避免了用户由于穿着较少而产生的不便与尴尬。已有方法很难有效且高效地估计衣服遮挡下的身材尺寸。为了有效地去除衣服的影响,我们构建了一个含3套常见衣服、共6042 × 3个三维未着装及着装人体对的数据库,该数据库对人体身材估计及布料仿真领域的研究具有重要意义。为了高效地估计身材尺寸,我们设计了一组人体标志点,作为连接着装图像与身材尺寸的桥梁。基于构建的着装人体数据库,我们提出一种数据驱动的快速衣服尺码推荐方法。首先,我们回归图像中的人体标志点,其次根据标志点学习身材尺寸。最后,根据身材尺寸,自动地查询服装尺码表,便可推荐衣服尺码。实验结果表明我们的方法能够有效且高效地去除衣服的影响,进而估计衣服遮挡下的身材尺寸。·我们提出了一种针对着装图像的三维人体重建方法。在网上购衣时,为了帮助用户决策及提升交易成功率,我们不仅需要准确的衣服尺码推荐,还需要生动可靠的穿衣视觉效果,这就要求重建出与用户身材一致的三维人体模型。针对着装图像引入的难点,我们采用上段所述的利用着装人体数据库和人体标志点的解决办法。与之不同的是,为了重建三维人体,我们先回归三维人体标志点,然后以三维标志点作为约束,优化求解参数化人体模型的参数。为了更有效地刻画标志点与着装人体剪影的关系,我们提出一个基于标志点的特征描述,改善了标志点回归结果。我们还做了丰富的对比实验来验证实现方面的关键配置,以进一步改进结果。在保证重建准确度的前提下,我们的方法大大提高了人体重建效率。三维标志点回归及三维人体重建过程共耗时不到4秒,而目前最快的针对着装图像的三维人体重建方法需要1分钟。·我们提出了一种面向普通用户的便捷三维人体重建方法。先前两个阶段的工作均在PC机上运行,且需要额外的抠图工具(如Photoshop)从日常照片分割出着装人体作为输入,给用户带来了一定的不便。于是,我们基于移动设备开发了一个对用户友好的三维人体重建方法。由于移动设备相比PC机来说资源有限且计算能力较弱,所以需要更高效的人体重建方法。我们基于构建的着装人体数据库学习从着装人体剪影直接回归人体参数,而不是以点为约束迭代优化求解人体参数,该过程在一个普通的安卓手机上耗时约1.26秒。为了直接使用手机拍摄的照片,我们在移动端开发了一个对用户友好的交互抠图工具,用来从日常照片提取着装人体剪影。此外,我们还设计了避免相机标定的策略,进一步改善了方法的方便性。·我们提出了一种参数化的语义身材模型,并基于该模型根据身材尺寸重建及编辑三维人体身材。已有参数化人体模型的参数对人体身材的控制不具备语义性,这里有语义的控制指如“腿变长”等直观的变形控制。我们根据身材尺寸将模板人体划分为若干部分,并基于数据库分析每个人体部分在对应尺寸变化方向上的顶点位置偏移,以学习语义基。为了更完整地表达人体空间,除了语义基外,我们还学习了非语义基。我们仅使用语义基表示训练库人体,然后计算其与Ground Truth人体之间的差异,通过分析这种差异学到的基为非语义基。语义基实现了模型参数对身材的直观控制,增强模型对局部变形的表达能力,而非语义基保证人体各部分之间的连贯性。我们还学习了身材尺寸与人体参数之间的映射关系,以根据尺寸重建或编辑三维人体身材。为了给用户提供便利,我们允许任意个数的尺寸信息作为输入,并采用一个基于相关性的方法根据已知尺寸预测未知尺寸。实验结果表明我们的方法减小了尺寸估计误差,展示了语义身材模型在人体重建及编辑方面的性能。