基于深度学习的单幅图像平面三维重建

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jsj19871027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据图像进行三维重建是计算机视觉领域热门的研究课题,被广泛运用于自动驾驶,机器人导航,虚拟现实,增强现实等应用之中。传统的三维重建方法通常依赖于特定的硬件设备或者多视角图像,这在实际运用中是容易受限的。同时,传统的三维重建方法多用点云表示重构的三维模型,这在数据存储和处理上是不方便的。而在实际的应用场景中,我们周围的环境通常具有明显的平面结构,比如地面,建筑物表面等等。因此,用平面结构来解析三维场景是一个更好的选择,既可以节省数据的存储空间,也方便于计算机对三维模型的处理。为了解决上述问题,我们探索了根据单张图像进行平面三维重建的方法。该任务要求输入单张RGB图像,然后用平面结构来解析三维场景。然而,相机成像是一个投影过程,损失了深度信息。因此根据单张图像进行三维重建是个不适定问题,需要添加大量的先验知识约束解空间。近年来,随着深度学习技术的巨大进步,在众多计算机视觉任务上都取得了成功。深度神经网络具有强大的拟合能力,能自动从数据中学习先验知识。因此,非常适合单幅图像平面三维重建任务。本文我们从实际应用场景出发,将重建的场景分为室外场景和室内场景。由于室外场景存在范围广,真实的平面三维信息标注难以获得的问题,使得目前大多基于监督学习的方法不在适用。在本文,我们尝试采用无监督的方法解决该问题。我们首先利用卷积神经网络预测场景的深度信息。为了解决深度信息标注缺失的问题,我们采用自监督学习的方式,通过优化不同视角下图像的重构损失,间接的训练网络。然后,我们通过无监督的平面拟合方法提取场景的平面结构。在这个过程中,我们也引入语义信息辅助平面三维重建。实验结果表明,我们的方法能在缺少三维信息标注的室外场景下,完成平面三维重建。而对于室内场景,我们则聚焦于房间主体结构的平面三维重建,需要根据单张图像重构出封闭的三维房间布局。大多先前的房间布局重建方法依赖于立方体假设。在本文,我们考虑了一个更加通用的房间布局假设,即房间由一个天花板,一个地面和若干竖着的墙面组成。基于此假设,我们首先运用卷积神经网络检测平面和相邻墙面之间的竖线,同时,我们也估计每个平面的3D参数。然后采用几何推理的方法实现了房间布局重建。除此之外,我们还通过优化平面参数使检测的平面与交线在几何上保持一致,提升了重构效果。实验结果表明我们的重建方法能处理多种复杂的房间布局结构,展示了我们方法的有效性和高效性。
其他文献
随着信息与科学技术的繁荣发展,未来现代电子信息作战具有装备信息化程度高、交战过程实时变化性强、战场信息不确定性强、博弈强对抗等特征。指挥员针对敌方战场信息的认知提出了更高的要求,但传统的方法过于依赖专家提取特征,人为提出特征间的关系会带来主观性过强、经验依赖性过高以及实时性较差等问题。贝叶斯网络作为基于图论与概率统计的图模型,以数据学习为核心,避免了人为主观性过强等问题从而在许多领域发挥重要的作用
随着科技的发展与工程需要的多元化,计算技术在图像识别领域中的应用越来越广泛。其中卷积神经网络具有优秀的图像识别效果,相比于常规图像识别算法,它具有更为有效的特征提取结构以及识别结构,已成为图像识别领域中主要技术之一。众所周知,图像样本的质量、数量是影响图像识别的关键因素,但是在一些重要专业领域,如遥感、雷达、医疗等,不仅面临获取大量、高质量的图像数据存在困难,更面临对这些专业图像标注的专业人力不足
众包是一种分布式的计算范式,它可以整合社会中的群体智慧来完成一些计算机或非专业人员无法完成的复杂任务。共享经济社会的形成,推动了一种基于位置的众包服务应用——空间众包的出现和发展。它在便利生活、智能交通等生活领域贡献了巨大价值。空间众包中基本且核心的研究方向包括任务分配和用户隐私保护,但以往的研究大多仅关注众包任务和工人,而忽略了需要不同专业领域知识的多技能任务分配。其次,由于空间众包是基于位置的
近年来,移动智能设备(如智能手机和平板电脑)在商业上取得了越来越大成功,已经成为全球数十亿人日常生活中不可或缺的元素。移动设备不仅用于传统的通信活动,如语音通话和信息通信,还用于大量的多用途应用,如金融、游戏、视频会议和购物等。移动用户日常上网行为不仅带来了流量的爆炸式增长,同时也使用户行为呈现出复杂性和多样性。因此,深入分析移动应用流量,识别用户异常行为对移动互联网的安全防范具有重要意义。本文的
随着网络环境日益复杂,越来越多网络协议开发者选择构建私有协议来进行数据的发送和接收,以满足其个性化需求。但是也有许多恶意应用程序利用私有协议来进行网络数据的传输,大大降低被破解的可能性,同时让此类非法活动变得更加隐秘,给网络安全带来巨大威胁。因此,对这些未知协议进行分析和处理,是网络安全领域亟需解决的问题之一。采用传统的从软件层面逆向分析二进制代码的方式不仅实现复杂、可移植性低、无法分析加密程序,
在人类探索世界的过程中,存在着许多无法到达的场所,而足式机器人由于其承载能力强、稳定性好、适应各种不同地形而成为研究重点,六足机器人由于其相对四足机器人可以实现更好的稳定性,而与八足机器人相比,六足机器人机体结构又更为简单,因此有更简单的运动控制策略,因而有其重要应用。本文设计构建了六足机器人模型,从足尖轨迹规划、中枢模式发生器、深度强化学习三种运动控制方法对机器人运动控制策略进行了研究与仿真。本
新能源汽车代表着汽车电动化与智能化的发展走向。四轮轮毂电机独立驱动的汽车方案有着简洁的传动机构和更高的可控自由度,其动力系统一直是研究的热点。本文以四轮轮毂电机独立驱动的电动汽车为研究对象,对整车动力系统方案、动力系统域控制器平台设计展开研究。主要研究内容如下:(1)针对电动汽车建立动力系统仿真计算模型,用于分析其动力性能指标,主要包括分析该汽车动力驱动系统对驱动力矩、电机转速、动力驱动总功率等需
近几年各类新兴技术例如量子科技、区块链以及人工智能迅猛发展,给传统网络带来了极大的挑战,而网络虚拟化技术为传统网络能满足多元化的网络需求带来了可能性。本文主要从以下两个方面对虚拟网络映射问题进行研究:针对深度卷积神经网络的计算负载会使终端设备产生大量能耗的问题,本文将深度卷积神经网络的计算任务作为虚拟网络请求,将它映射到多个终端设备上,由多台终端共同分担计算来减少对自身的损耗。在实现时将神经网络每
同步定位与建图(Simultaneous Localization And Mapping,SLAM)已经在机器人视觉领域进行了几十年的研究,但是基于传统建图方法下的深度估计花费时间长,很难达到工程上要求的实时性,而且地图中不具包含义信息,使得三维建模在应用方面的拓展受阻。基于这些问题本文设计了一种基于深度学习的单目图象深度估计的方法,提高建图速度,同时设计了一种融合的语义分割网络,让整个系统能够
网络服务器和个人主机经常受到网络黑客的威胁,他们使用恶意制作的数据包来利用软件漏洞并获得系统管理员权限。尽管当前研究人员针对软件漏洞及相应防御方法进行了大量的研究,但此类攻击仍然是安全领域最大的问题之一。随着数据执行保护和W⊕X的广泛部署,攻击者被迫在二进制文件中重用现有的代码片段。代码重用攻击可以执行任意的图灵完备计算而不用注入任何恶意代码。其中,面向返回的编程(ROP)已经成为攻击者规避最新操