基于深度学习的单视图物体三维重建技术研究

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:braveheart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体三维重建已经广泛应用于自动驾驶、3D打印、虚拟仿真以及VR游戏等多种场景,涉及了生物学、神经科学、生态学和农业等多个领域。随着深度学习的发展应用以及大规模三维物体重建数据集的建立,利用深度神经网络从单幅图像中恢复物体三维形状引起了越来越多的关注。现有的深度学习方法通过采用不同的几何表示和不同的深度神经网络框架进行单视图物体三维重建已经获得了不同程度的成功,然而这些工作在重建精度和不同类别物体重建的泛化能力上都存在不同程度的不足。本文在现有研究工作的基础上,继续对基于深度学习的单视图物体三维重建技术进行研究,主要工作总结如下:(1)针对拓扑结构简单的物体(飞机、汽车、长椅、沙发等类别模型)总结并提出了一种基于自由曲面变形方法的深度神经网络模型,该模型首先利用编码器-解码器-预测器结构从输入图像中提取图像控制点矩阵,然后通过一个基于Point SIFT的自适应模型降维网络从模板模型中提取模型控制点矩阵,最后利用模型变形矩阵通过自由曲面变形方法对模板模型进行变形,从而获得和图像中物体特征相似的三维模型。(2)针对拓扑结构复杂的物体(如桌椅等)提出了一种中心骨架与自由曲面变形方法结合的骨架修正网络模型,该模型首先利用骨架重构网络通过单幅图像生成物体粗略的点云骨架,然后将点云骨架作为自适应生成的模板模型,通过不同的特征提取网络分别从图像和点云骨架中提取控制点矩阵,最后利用自由曲面变形方法对点云骨架进行细节修正,从而实现复杂拓扑物体的高精度点云重建。(3)开发了基于Py Qt5的单视图物体三维重建软件,该软件可以通过单张图像对图像中物体进行点云重建,在提供掩膜的情况下,支持真实场景的物体三维重建,并且提供了重建可视化的相关操作。在公开数据集上的对比试验中,本文所提出的方法在点云重建精度和泛化能力上都取得了较好的效果,证明了其有效性。
其他文献
目前,视觉复杂问答系统已经能够在CLEVR数据集上对视觉问答系统所不能回答的复杂问题进行解答。但是,目前的视觉复杂问答系统存在一些缺陷,其中主要包括,由强监督学习引起的模型过拟合、标注成本过高以及泛化能力差的问题;由模型结构缺陷引起的系统难以处理长问题的问题;由贪婪算法引起的系统陷入局部最优解的问题。针对视觉复杂问答系统存在的上述问题,本文首先分析讨论了上述问题出现的原因。随后,针对这些问题提出了
训练样本类别不均衡容易导致分类模型过度偏好,降低少数类样本识别精度。该问题的解决方法包括数据层面的过采样方法、欠采样方法及算法层面的集成学习。现有的过采样算法生成的样本具有局限性,并且忽视了类内不均衡问题,为此本文提出一种基于高斯混合模型和JS散度的过采样算法(GJ-RSMOTE)。该算法使用高斯混合模型对少数类样本聚类,并在超球体内生成新样本,最后利用JS散度控制采样数量。通过在UCI数据集和地
石油和天然气的开采需要各种昂贵的材料和复杂的设备,这些设备和生产设施均需要进行定期维护,以保证油气开采效率,降低不必要的维修和生产成本。这些维护任务包括安全保障任务、环境保护任务、生产设施常规维护管理任务,以及一些预防性、预见性的设备维修任务。目前,还没有专业的调度软件实现维修任务的人员调度和路径规划决策,仍然采用人工手动排定的方法进行任务的分配和路径的规划,调度决策存在着效率低下、人员利用率低等
随着社会经济的迅速发展,石油能源的需求越来越大,开采量逐渐上升,但是安全问题制约了油田开发力度。现阶段的违规行为识别主要依靠人工巡检,工作强度大且效率不高。同时,油田各井场的摄像头数量多、高度较高、距离较远,因此,目标的尺寸较小,检测难度大,检测结果不稳定。为了实现油田视频监控的智能化,本文进行了以下研究:(1)提出了基于设备检测的油田施工场景识别方法。使用K-means算法对设备尺寸进行聚类分析
随着传感器技术和机械制图的发展,三维模型数量呈爆炸式增长。在计算机视觉领域,研究人员将目光从平面上的图像应用转移到表征真实世界的三维模型的应用。三维形状分割是三维形状分析的基础,是计算机视觉中检测和识别物体信息的基础。对三维模型进行形状分割,确定模型中每个网格包含的语义,通过对每个语义成分更深入的分析,可以实现形状对应与匹配、模型检索等任务。对于网格的三维形状分割,早期学者从计算几何角度出发,通过
安全生产一直是石油生产及化工领域的关注话题,海洋油气开采更是如此。对于深水油气田开发,所处的为高压、强腐蚀性及复杂的海底环境,并且水下生产系统复杂,零部件众多,一旦出现故障,可能造成原油的泄露,影响安全正常生产,造成海洋污染和严重的经济损失。深海油气田开发水下生产系统的安全运行得益于水下控制系统可靠性水平的不断提高,水下控制系统作为水下油气系统的关键设施,较陆地控制系统更难控制与维护,因此对其可靠
现实生活中存在许多复杂的数据,例如:社交网络中的用户交互、产品购买和有机蛋白质之间的交互等等。可将其描述成一个由相互作用的边连接的节点构成的网络,即复杂网络。社区发现是复杂网络分析的重要技术之一,其目的是发现网络中具有内部高内聚性,但与网络的其余部分相对隔离的一组节点。可见,社区发现有助于了解构成复杂网络的性质、动态行为,从而提高网络数据的可视化水平。近年来,随着各种网络的规模急剧增长,检测大型网
近三年来,深度学习(DL)在多聚焦图像融合领域的理论研究是一个热点课题。多聚焦图像融合的目的是将部分聚焦的图像整合到一个全聚焦的单个图像中,为了达到这个目的,本文针对基于深度学习的多聚焦彩色图像融合方法展开研究,主要研究成果如下:(1)基于DCNN和QUADTREE的多聚焦图像融合算法此项工作中主要解决DCNN算法中没有对未知区域处理的问题。首先利用DCNN算法得到粗糙的聚焦概率图,通过设定两个自
近年来,为更好地满足油气生产需求,各种新技术被陆续引入到水下生产系统中。水下生产系统的工程建设和应急维护需要综合考虑环境、经济、安全等相关因素,很多操作都不被允许实施。因此,本文结合虚拟现实仿真技术、半实物仿真技术与监控技术,对水下生产虚拟现实仿真操作监控系统进行设计与实现,该系统可为无经验的操作人员和管理人员提供丰富的水下施工经验,降低作业风险。本文首先对操作监控系统进行了详细的分析,结合工程建
调制识别是介于信号检测和解调之间的一种非协作通信识别技术,其主要任务是实现对已调信号的智能接收、处理和分类。数字信号识别的准确性关系到国计民生的多个方面,在民用领域调制识别可以实现无线电频谱管理和智能化控制,在军事领域可以实现对敌方情报的监测并保护国家信息安全,经过多年的研究已经获得了许多成果。随着调制方式和信道环境复杂度的提升,如何在低信噪比下精准识别各种调制方式成为一个重要问题。因此,面对未来