基于深度学习的三维场景分割研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:czh19890220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和网络技术的快速发展以及低成本的3D传感器(如Kinect)和光场摄像机的日益普及,无人驾驶、智慧城市、虚拟现实(Virtual Reality,VR)、增强现实(Augemented Reality,AR)等技术已经成为学术与工程应用上的热点,而上述技术的快速发展源自计算机对其周围环境的感知能力不断增强。人们希望计算机像人类一样观察真实场景,并智能地给出解决方案,即使用视觉传感器将真实数据存储在计算机中,让智能系统将根据实际情况对数据进行分析并做出相应的判断。本文主要研究三维场景理解技术,包括大规模建筑物分割与修复、三维点云语义分割和三维场景快速目标检测算法。通过大量实验和数据分析,结合公开数据集和自制数据集,验证算法的有效性和优越性。主要研究内容以及贡献如下:(1)针对传统大规模建筑物分割时边界模糊问题,提出一种新的能量函数方法,可将从无人机(UAV)中提取的点云生成的网格模型聚合,补充上下文语义精确分割建筑物,最大限度地提高提取建筑物的一致性,恢复边界信息。同时利用语义信息来提高所提取的输入模型语义段之间标签的一致性,以保证分割结果的有效性。另外提出一种利用非结构模型重建多边形和圆弧模型的新方法,可以稳健地发现邻接关系集,并对点云损失引起的非水密模型进行修复,其结果相对于Ball Pivoting等算法更加紧密。经实验验证,本章算法比Poisson等算法效率提升至少9%以上。(2)在大规模三维场景的语义分割上,本文设计一种基于稠密条件随机场(Dense Conditional Random Field,DCRF)的快速深层神经网络模型,可对三维点云场景进行精确的语义分割。在此基础上,实现一个紧凑而灵活的框架,完成对场景点云的精确语义分割,其分割的精确度比传统逐点三维点云语义分割算法提升3%以上。在获取的语义分割结果基础之上,实现一种新的DCRF算法对分割结果进行优化,使经过该模型优化后的场景更具有区域紧密性。与此同时,在不牺牲分割精确度的前提下,对点云的原始数据进行优化,使得网络处理的数据更少,所花费时间减少50%以上。(3)针对三维场景目标检测效率低下的问题,提出一种混合多种深度学习网络的模型,混合二维目标检测、三维语义分割及空间选框优化等技术,实现对区域中特定物体的快速检测。通过分析FPN网络以及快速三维点云语义分割网络,提出二维与三维混合的目标检测网络,能够在不丧失精度的情况下极大的节省检测的速度,经验证其所花费时间减少30%以上。
其他文献
深度学习发展至今,学术界逐渐将心电信号的研究目光转移至传统方法与深度学习相结合的研究上,原因在于心电信号的广泛数字化,促进了深度学习在心电信号上的应用。传统的心电信号标准化解释包含信号预处理、手工特征提取、以及心电信号分类三个部分,每个部分既相互独立又相互依赖,例如手工设计特征的泛化性与心电信号分类模型的性能息息相关。基于深度学习的心电信号分类能够做到端到端的训练,不依赖于信号预处理和手工特征选取
近年来,步态识别等生物特征领域的研究越来越被人们所关注。步态识别不同于人脸、虹膜识别等静态识别,这种方法可以通过在远处拍摄视频来进行识别,而不需要使用过多局部细节,克服了当前生物识别的一些局限性。步态识别技术优势明显,可以克服当前人脸识别等方法的缺点,能够在复杂场景下获得较为广泛的应用。提高步态身份识别的准确率有助于提升效率、减少工作量,尤其在车站行人身份检测、身份验证等方面的效率将会有非常大的进
随着人工智能与智能制造逐渐兴起,为适应复杂多变的外部环境,智能化技术成为当前的研究热点。为提高控制系统的智能化程度,本文搭建了视觉感知的智能欠驱动机械臂平台,设计了基于机械臂末端视觉的目标检测、跟踪算法,并对其性能进行了验证。本文的主要工作有:一、设计了用于图像特征提取的视觉感知模块。本模块经图像预处理、目标检测、特征点提取及更新的流程后,可实现对目标特征点的有效提取。基于对本文环境下相机成像特点
近年来,随着定位导航技术的逐渐成熟,使移动机器人在未知环境中的自主导航成为可能。但是即使是当前最先进的同步定位与建图(SLAM)技术,也会因为传感器中的噪声而给地图中障碍物的定位带来不确定性。典型的路径规划算法都关注如何降低这种不确定性,而本文将从另一个角度来解决这种信息的不确定性。针对环境信息的不确定性问题,提出了一种基于Voronoi图与不确定性势场算法的路径规划方法,使移动机器人在信息不确定
推荐系统作为一种个性化的信息过滤工具,随着大数据时代的到来得到了越来越广泛的应用。与此同时,推荐系统也面临着发展和挑战,比如数据稀疏性、缺乏可解释性等问题。现有的推荐模型难以处理稀疏的结构化数据,忽略了用户行为序列蕴藏的偏好信息,并且无法为推荐结果提供合理的解释。为解决上述问题,本文围绕点击率预测任务,深入研究基于深度学习的推荐算法,提出了两种可解释个性化推荐模型,并设计实现了一个金融产品推荐系统
自从第一个巡航遥控机器人“月面巡视器1号”降落在月球上,开发一种能够自主探测月球和火星等地外天体的星表巡视器成为了航天领域长期关注的热点问题之一。路径规划是月面巡视器在星表自主作业、安全漫游与探测的重要保障。目前月面巡视器路径规划的研究工作多集中于地形可通过性分析上,很少涉及光照、通信等潜在约束条件。人类的决策有助于巡视器应对自主导航功能无法处理的突发情况,提高整个路径规划系统的性能。本文针对现有
包含加速度计、陀螺仪和磁力计的微机电系统(Microelectronic Mechanical System,MEMS)MARG(magnetic,angular rate and gravity,MARG)传感器阵列被广泛应用于多运动载体姿态测量。目前,多传感器数据融合理论发展迅猛,众多MARG数据融合方法被提出以估计载体的位置、速度和姿态。然而对于多载体协同MARG姿态估计,依然面临运动加速度
随着人工智能技术的深入发展,移动机器人在社会生活各个领域的作用越来越突显。其中,SLAM技术是移动机器人研究领域一项至关重要的技术。SLAM技术的重要特征就是“同时”,即定位与地图构建同时进行,通过这一技术,结合路径规划算法移动机器人即可实现自主运动。而无论是机器人的定位还是环境地图的构建,都需通过外部的传感器对周围环境的变化进行实时的感知。其中激光雷达以其精准度高、获取数据速度快以及扫描范围广等
在第五代移动网络快速普及的背景下,互联网中吞吐的海量流量数据种类繁多,增加了网络流量分类问题的难度,对分类器的速度和准确性提出了更高的要求。如何通过分析网络流量实现网络态势感知,及时发现网络异常情况并采取针对性处理措施,对于实施网络安全审查制度,加强网络安全管理,检测和抵御网络入侵,维护国家网络安全等都有着重要意义。传统的基于端口的分类方法在日益复杂的网络环境中分类性能不可靠,基于深度包检测技术的
移动机器人实现自身的精确定位是其执行任务的前提条件之一。近年来,基于视觉信息的定位技术已成为移动机器人自主导航定位的重要研究课题,但是在图像特征不够丰富或者光照不好的情况下,会出现特征丢失的问题,从而造成方法的鲁棒性差。惯性测量单元(Inertial Measurement Unit,IMU)传感器不受光照的影响,在视觉传感器快速移动和图像特征缺失的情况下,依然能精确的输出测量结果,同时相比视觉传