基于卷积神经网络的离散三维点云处理研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:zmjmengm1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度传感器技术如激光雷达设备、RGB-D相机的不断发展、成熟,3D点云数据质量、获取效率及性价比不断提升,被广泛应用于无人驾驶、智慧城市、测绘遥感等领域、行业。点云数据作为三维重建技术的主要数据格式,已广泛应用于三维模型及场景的分类分割任务中,其中,基于深度学习的三维点云分类分割方法由于其性能的优越性越来越受到关注和研究。Point Net和Point Net++作为最早提出的点云处理系列网络,虽成功解决了点云无序性等问题,但依然面临局部特征提取不充分的问题。针对这一问题,本文将自注意力机制引入Point Net++构建点云语义分割网络SSA-Point Net++以进一步提高复杂场景点云语义分割精度。本文主要工作如下:1.首先从多视图、体素、离散点云三个方面总结了目前基于深度学习模型的3D点云分割研究现状;进而对卷积神经网络背景知识及发展进行了简单回顾,并对改进网络中用到的注意力机制理论基础进行了阐述;最后对本文3D点云分割深度学习采用公共数据集及评价指标进行了说明。2.在Model Net40和S3DIS数据集上对经典的直接点云语义分割神经网络模型Point Net、Point Net++进行验证,分析给出其网络优缺点,从而为后续网络模型设计、性能提升奠定基础。3.在Poinet Net++基础上引入自注意力机制提出SSA-Point Net++点云分类分割网络模型,并将空间自注意力机制明确分为采样点、邻域自注意力机制,综合两者并通过不同的空间编码方式来增强采样点邻域拓扑结构学习能力;构建注意力池化模块并通过差异性池化函数来整合注意力机制池化、最大池化提取的多个全局特征,利用空间自注意力机制对显著性特征的自适应筛选来强化重要信息在网络的传递。本文在公开数据集Model Net40、S3DIS、Semantic3D进行的三维模型分类及室、内外场景语义分割实验。实验表明,数据集Moedl Net40上分类精度达到93.1%,较Point Net++提升达1.2%。数据集S3DIS上的m Io U最优且较Point Net++提升达6.3%,数据集Semantic3D上的m Io U高出次优精度约3%;相比于公开数据集上其它网络模型的分割结果,本文算法性能均有不同程度的性能提升,具有更强的泛化性能及良好的应用价值。
其他文献
稀土掺杂荧光材料在高压电力系统、油井、生物医学检测等特殊测温领域具有广阔前景,成为国际上的研究热点。氟磷灰石荧光透明玻璃陶瓷具有声子能量低、高灵敏度、热稳定性好和易制备加工等优点,在上述应用领域具有优势。因此,开展氟磷灰石荧光透明玻璃陶瓷材料的研制具有重要的理论意义和应用前景。本文通过高温熔融法制备了稀土掺杂CaF2-ZnO-P2O5-B2O3、BaF2-ZnO-P2O5-B2O3磷酸盐和CaF2
社会生活中,很多领域都使用了计算机视觉技术,其已被广泛应用于视频监控、机器人视觉以及无人机侦察等诸多领域。目前已有大量学者对正常照度图像开展了大量研究,但低照度图像的研究却很少。整体光照不足或局部光照不均的场景捕获的图像存在亮度低、对比度不足和细节信息严重丢失等问题,致使该类图像无法达到人们预期的要求,同时严重影响到该类图像的后续应用。本文针对低照度图像增强课题展开研究,通过研究图像增强技术以提升
随着科技的发展,网络成为人们工作生活的重要工具。人们通过互联网,跨越空间局限,实时接收外界消息,并通过社交平台更迅速、便捷地进行信息的传播和共享。在这样的背景下,人的行为和决策往往会受到他人的影响,社会化营销因此越来越受到学术界和工业界的关注。影响力最大化问题,即从社交网络中寻找有影响力的个体,从而使产品的受众或信息的扩散最大化,也相应得到了广泛研究。然而,以往的研究主要集中在单一信息的扩散或正面
随着数字化时代的进一步到来,宽带无线接入技术迅速发展,移动技术得到了广泛的应用。基于位置的服务(Location Based Services,LBS)对精准定位的需求越来越急迫。智能终端支持Wi Fi和蓝牙功能,促使室内定位技术进一步向Wi Fi和蓝牙技术倾斜。研究Wi Fi定位、蓝牙定位以及二者融合的定位技术具有很大的应用价值。针对Wi Fi和蓝牙接收信号波动,且单一定位技术定位误差大、稳定性
基于位置社交网络(Location-based social network,LBSNs)服务中,用户可以通过在线平台轻松地在物理世界中共享其地理空间位置和与位置相关的内容,但如何挖掘LBSNs中的结构和行为等丰富且复杂的信息实现有效的位置相关推荐服务仍然面临挑战。协同过滤假设相似的用户对同一项目的行为相似,以此为依据来实现个性化推荐。基于协同过滤的位置推荐系统通常假设用户和位置的交互事件是独立的
目前,机器学习在医学领域已经成为一种有效的工具,其中最为突出的是基于机器学习的医学图像辅助诊断。计算机辅助诊断可以提高医生在医学图像检测、识别和分割任务中的能力。在医学图像分析研究中,一些基于机器学习的方法取得了优异的性能。然而,这些方法在使用有监督训练时严重依赖于大量的有标记数据集。而在大多数情况下,获取大规模特定医学图像的有标记数据集是很难实现的。以往大多机器学习算法的研究采用数据增强方法。数
随着通讯技术和网络技术的不断进步,物联网(IoT)在各个行业广泛应用,无线传感器网络(Wireless Sensor Networks,WSNs)作为物联网的基础受到了研究者的关注。WSNs由大量传感器节点构成,通过无线通讯的方式形成局域网络,用于完成环境监测、信息采集、区域监控等任务,其中事件源与被监控对象联系紧密,源节点位置信息的泄露意味着网络隐私安全受到威胁,因此,源节点位置隐私保护(Sou
太赫兹技术是一个典型的跨学科前沿领域,它为科技发展和社会进步提供了重要的契机,其结合了电子学领域与光子学领域的特色,是21世纪产业的最新科技基础。当前,缺乏有效的太赫兹功能器件,是限制太赫兹技术发展的重要因素之一。太赫兹超材料吸收器是一种重要的功能器件,在太赫兹成像、传感和隐身等领域应用前景广阔。然而,现有太赫兹超材料吸收器一旦被制造完成,吸收性能很难改变,导致吸收器的应用范围受到极大限制。二氧化
本文主要是以Gd2O3-Fe2O3-Bi2O3体系及相关化合物为研究对象,通过固相法来合成973 K下的体系实验样品,确定相平衡关系与晶体结构等。在相图的基础上通过溶胶-凝胶法制备样品,研究Gd元素添加对于Bi Fe O3以及AB位调控Gd Fe O3化合物的相结构、微观形貌、元素价态、磁性能和微波吸收性能的影响。利用X射线衍射方法,实验测定了Gd2O3-Fe2O3-Bi2O3体系在973 K下的
视频行为识别技术经过近几年的快速发展,已被广泛应用于安防、医疗、人机交互等众多领域。在过去,行为识别服务大都部署在云中心上,但随着行为识别研究逐渐由离线处理转为对视频流的实时计算和分析,以及大量视频数据源逐渐转移到边缘节点,云计算正变得不适合行为识别服务。因为远离数据源的云服务在接收数据时可能会面临网络拥塞、带宽不足等问题,不能满足较高的实时性要求。边缘计算是一种将计算任务和服务从云中心转移到边缘