基于单幅图像的三维模型生成方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:lawrence121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维建模技术在诸多领域都有着越来越广泛的应用。而目前常用的三维建模软件需要用户付出很高的学习成本,对于普通大众而言很难使用。基于图像的三维模型生成系统则有着简单易用的特点,因此如何从图像中生成三维模型受到了学术界和工业界的关注。为了给用户在模型生成过程带来极大程度的便利,本文致力于解决基于单幅图像的三维模型生成问题。然而单幅图像的模型生成任务是一个病态问题,需要很强的三维模型先验进行辅助。近年来大量文献致力于利用神经网络进行基于图像的三维模型生成工作,这是由于神经网络相比于基于视觉线索的方法而言具有更强的先验学习能力,能够打破对应用场景的诸多限制。因此本文为解决该问题,设计并实现了一种基于神经网络的多阶段三维模型生成方法。具体而言,本文工作包括以下三方面内容:(1)设计了一种基于单幅图像的三维模型生成方案。在该方案中,本文首先用多视角2.5维视图估计器从单幅RGB图像中预测多个特定视角下的法向量图和深度图(本文称特定视角下的法向量图和深度图为2.5维视图)。随后,本文使用点云生成器根据预测的法向量图和深度图推理出完整的三维模型。通过该方案,可使得最终生成的三维模型具有更细致的形状,且对自遮挡具有更强鲁棒性。(2)设计并实现了一种多视角2.5维视图估计网络。该网络用于从单幅RGB图像中估计多个特定视角下的法向量图和深度图。本文通过基于可见率(图像中对象的可见部分面积与总表面积之比)分析的最佳视角选取过程选定若干预测视角,并采用由卷积神经网络构成的编解码器架构实现对被选定视角下的法向量图与深度图的预测。(3)设计并实现了一种三维点云生成网络用于三维模型的生成。本文使用了循环神经网络融合多个视角下的2.5维视图,并且为避免深度卷积网络训练时可能出现的梯度弥散现象,本文使用深度残差网络作为编码器。在解码器设计中,本文使用了双分支解码结构分别关注于被生成对象的主体部分和细节部分。
其他文献
国家提出“中国制造2025”战略,目的是大力发展工业自动化,扭转我国自动化方面的落后局面。随着伺服电机、四轴机器人等自动化组件应用技术日趋成熟及普及,各行业均对现有工
随着各类传感器大量搭载于移动终端,时空数据大量累积,如何从海量数据中发现有效信息是当前研究的热点。异常检测作为时空数据挖掘的重要分支在军民领域有着重要应用,可广泛
随着电子器件微型化,微机电系统(MEMS)得到了进一步的发展,功能器件的相对功耗得到进一步降低。通过环境能量采集器捕获、采集到的能量将足以支持电子器件完成功能任务,而不
冲击波信号属于典型的非平稳随机信号,具有信号频率范围广、幅度变化速度快、持续时间短等特点,因此对冲击波测试系统的动态性能具有很高要求。为了解决在冲击波测试过程中,
近年来,随着城市机动车数量的增加,由机动车尾气排放引起的生态和环境问题变得越来越突出,并成为了社会关注的热点问题。城市路网中行驶的机动车、工程器械等移动污染源排放
当今科学技术迅猛发展,光纤传感器因其拥有结构简单、抗电磁干扰能力强、灵敏度高等优点在工程应用中已占据举足轻重的地位。另一方面,新材料的出现对人类社会的发展同样发挥
图像是重要的信息载体,计算机图像处理技术促进了人类科技的发展,提高了人类生产生活水平。计算机图像处理技术已应用在航空航天、道路交通、生物医学、工业检测,通信和安防
随着人工智能的不断进步,深度学习可以训练生成各种场景应用的模型,譬如生物识别、行人检测、人脸识别等,将人工智能与实际应用相结合。而深度学习中识别特定目标最重要的一
行人重识别是检索图像或者视频序列中跨摄像头的特定行人的技术,是计算机视觉和模式识别领域的研究热点之一,具有明显的研究价值和技术挑战性,在智能视频监控、智能安保等领
本论文采用模板法、水热法和超声化学沉积法制备出三种基于ZnO或者SnO2的气敏材料,考察了制备材料的结构特性和气敏性能,具体研究内容如下:以有序多孔ZnO为前驱体,采用水热法