【摘 要】
:
与图像这类具有规则形状的数据相比,点云这类不规则结构数据还没有一个基于深度学习公认有效的特征提取方式。点云内数据点的邻居选择对局部特征提取所造成的影响是一个值得讨论的问题,然而该问题却未被专门研究过。另外,点云数据中若存在噪声,则会在利用特征进行点云识别、分割、重建等任务时产生较大误差。基于自然语言处理领域中被广泛使用的注意力机制,结合自然邻居搜索算法,本文提出一种全新的点云特征提取网络模型。该网
论文部分内容阅读
与图像这类具有规则形状的数据相比,点云这类不规则结构数据还没有一个基于深度学习公认有效的特征提取方式。点云内数据点的邻居选择对局部特征提取所造成的影响是一个值得讨论的问题,然而该问题却未被专门研究过。另外,点云数据中若存在噪声,则会在利用特征进行点云识别、分割、重建等任务时产生较大误差。基于自然语言处理领域中被广泛使用的注意力机制,结合自然邻居搜索算法,本文提出一种全新的点云特征提取网络模型。该网络模型可以更好地提取点云数据的局部特征,进一步还可以将特征直接应用到点云分类与点云语义分割任务中,良好的特征提取方式还解决了含噪声点云在点云分类任务上出现的分类结果不准确问题。本文所做的主要工作如下:(1)提出了应用于点云特征提取的自然邻居搜索算法。针对点云数据,分别计算自然邻居与球查询邻居,并使用这两类邻域范围内的数据点进行局部邻域的特征提取与聚合。(2)在点云特征提取过程中使用注意力机制,结合自然邻居搜索算法,提出了自然注意力层。邻域内数据点自身所携带的特征会根据注意力机制被赋给一个不同的权重,重点关注几何特征明显的部分,并保证提取到点云局部特征的有效性。(3)根据特征偏移机制,结合残差网络与稠密网络的网络结构优点与特性,提出了基于残差自然注意力的点云特征提取网络模型。更具体地,对特征进行偏移量计算,以获取数据点之间的关系特征;使用残差网络与稠密网络,将自然注意力层的网络深度堆叠到4层以上,在保证特征提取能力的前提下,减少了训练过程中学习退化和梯度消失现象。(4)将本文提出的网络模型应用在点云分类与点云语义分割任务,以定性与定量的角度分别对特征的有效性进行了验证。针对点云分类任务进行扩展实验,分别使用了高斯噪声与背景噪声,构建了含噪声数据集,并对本文提出的网络模型抗噪能力与已有方法进行对比,证明了本文方法对噪声的鲁棒性。(5)通过消融实验,证明了在基于残差自然注意力的点云特征提取网络模型中,包括注意力机制、自然邻居搜索算法等在内的每一个组件与模块,在特征提取过程中都产生了积极影响。通过改变邻居搜索算法,探究了不同的邻域搜索方式对特征提取所造成的影响。
其他文献
推荐系统旨在帮助用户寻找其感兴趣的事物(项目),正被应用到越来越多的互联网服务中。推荐任务通常可形式化为评分预测任务,即预测用户对候选项目的评分。基于协同过滤(Collaborative Filtering,CF)的推荐算法因其出色的性能成为推荐系统评分预测任务的研究热点,但目前仍存在以下问题:1)用户对项目的评分数据普遍偏少从而影响了推荐效果的数据稀疏性问题;2)根据用户最近的评分数据快速捕捉其
国际疾病分类(International Classification of Diseases,ICD)是一种被广泛应用于疾病诊断编码工作的分类系统,其标准由世界卫生组织制定。在医疗实践中,人工ICD编码工作是易错且低效的,其中导致编码错误的最大原因之一就是合并编码情况没有被正确识别并处理。为了辅助编码人员进行编码工作,目前已经有不少关于ICD自动编码的研究涌现出来,但之前的研究都没有对合并编码给
多旅行商问题(mTSP)是著名的旅行商问题(TSP)的延伸。多旅行商问题的目标是寻找一组哈密顿圈,其中每个旅行商都被派往一组城市而且保证每个城市只能访问一次。目前已经有一些致力于求解多旅行商问题的研究,但是大多数研究集中在如何最小化所有旅行商的旅行距离之和(即,minsum mTSP),只有很少的研究是专门针对以下两类复杂多旅行商问题:1.最小化所有旅行商的最大旅行距离(即,minmax mTSP
膜计算是从活细胞的结构和功能中抽象出来的计算模型。该模型的进化规则执行具有不确定性和极大并行性。基于膜计算与进化计算相结合的膜进化算法将活细胞的生命活动抽象为进化算子,然后通过进化算子进化膜结构和膜内物质来求解优化问题。容量聚类问题(Capacitated clustering problem,简称CCP)是将无向图的顶点集划分为几个不相交的簇,使每个簇中的顶点权重之和满足容量限制,同时最大化同一
由于Android系统的开放性,Android应用程序能够通过非官方渠道安装在Android设备上,这为智能系统带来了安全风险。因此,研究如何检测Android恶意软件是非常有必要的。目前,许多基于机器学习的Android恶意软件检测方法都以应用编程接口(API)为特征,具有检测效率高、准确率高等优点。然而,由于这些方法将API作为一个独立的整体特征,当API因Android系统的发展而发生变化时
随着计算机视觉技术的发展,三维重建技术走入到人们生产生活中的方方面面。在众多三维重建的方法中,基于多视角图像深度估计的三维重建方法,是目前主流的三维重建方案之一。传统多视角图像方法使用图像的RGB信息来计算像素点的匹配代价,在弱纹理等RGB信息缺失的位置很难完成重建。随着近年来卷积神经网络在计算机视觉领域的发展,深度学习能够从图像中提取出更丰富的语义信息,将深度学习应用到三维重建领域逐渐成为了当前
传统行人监控主要依赖视频分析、红外成像等方法,难以有效兼顾经济性、隐私性、可扩展性等诸多要求。近年来,因WiFi具备分布性广、信号普适性高、感知灵敏性强等特点,基于WiFi信道状态信息(WiFi-CSI)的无源感知方法逐渐受到学术界与企业界的广泛关注。然而,目前研究大多基于样本学习方法,往往存在以下两点不足:a)离线阶段样本采集开销大,b)跨场景条件下感知鲁棒性不高且可扩展性不强。鉴于此,本文深入
视网膜是眼睛内部的重要组成结构,视网膜血管的异常变化与眼部疾病和部分全身性疾病息息相关。分析视网膜血管系统的特征不仅有利于疾病的诊断和治疗,而且对维护人体眼部健康和提高患者生活质量具有重要价值与意义。光学相干断层扫描血管造影(Optical Coherence Tomography Angiography,OCTA)是一种新型的、非侵入性的成像技术,在无需造影剂的情况下即可生成各个视网膜层和脉络膜
自卷积神经网络提出以来,计算机视觉有了巨大的发展,各种深度学习网络被提出,广泛用于高效处理图像数据。应用深度神经网络分析点云,学习点云特征的方法自然出现了,但是直接使用处理二维图像数据的方法处理三维数据并不可行,通过多层感知器提取点云数据的有效特征便成为了一个常用的方法。然而这种方法并没能够充分利用点云的层次化特征。在点云的层次化的过程中,常常经过分组和采样的操作,使得点云可以按照全局和局部两种方
三维点云的表面重建,指通过输入无序的三维点云数据,生成与之对应的、紧凑的、流形的、水密的网格模型。三维点云的表面重建,可应用于CAD/CAM,虚拟游戏人物、物体、场景等的快速建模,在智慧城市、游戏、电影、动画等领域有较高的应用价值。点云表面重建的主流方法有:基于构建点云表面隐式函数,根据隐式函数采用移动立方体(Marching Cubes)提取等值面,生成网格模型的表面重建算法;使用三角剖分,生成