基于层次化特征的点云分析

来源 :重庆大学 | 被引量 : 0次 | 上传用户:x1010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自卷积神经网络提出以来,计算机视觉有了巨大的发展,各种深度学习网络被提出,广泛用于高效处理图像数据。应用深度神经网络分析点云,学习点云特征的方法自然出现了,但是直接使用处理二维图像数据的方法处理三维数据并不可行,通过多层感知器提取点云数据的有效特征便成为了一个常用的方法。然而这种方法并没能够充分利用点云的层次化特征。在点云的层次化的过程中,常常经过分组和采样的操作,使得点云可以按照全局和局部两种方式进行处理,点云的空间特征和通道特征因此可以分为全局和局部两种特征,合理利用全局和局部特征对点云分析的效果重要的影响。本文提出了一种在点云中构建基于全局和局部位置的层次化位置编码,通过基于点云的全局和局部通道特征的通道注意力分析点云的深度神经网络,用于点云的形状分类和部件分割等后续任务。在网络中通过多层位置编码和通道注意力对点云特征进行提取,达到了提高分类分割任务准确率的效果。本文所做的主要工作如下:(1)提出了一种应用于点云深度学习的点云位置编码方法。针对点云的深度学习,从全局和局部两个层面,分别对点云数据进行位置编码,从而充分利用点云的全局和局部位置信息,提取点云的空间特征。(2)提出了一种应用于点云深度学习的通道注意力。在点云的深度学习的过程中,由于对点云的层次化特征提取,使得通道注意力可以通过关注全局和局部通道特征来学习点云特征通道的不同权重。可以借助通道注意力来使得点云的通道得到不同程度的加权,从而使得深度学习关注更有价值的通道。(3)针对点云特征提取过程中分层提取的特点,构建了一种新型的网络结构对点云的层次提取的结果进行充分利用,从而使得不同层的网络特征都可以对结果进行影响,可以通过堆叠多层提升特征提取的效果。(4)将本文提出的网络模型应用在点云形状分类,点云部件分割和点云室内场景分割任务,并通过实验对提出模型的有效性进行了验证。通过消融实验,证明了基于层次化特征的点云分析网络模型中,包括层次化位置编码,基于点云的通道注意力、层次化特征提取模块的作用。
其他文献
旅行商问题(Travelling salesman problem,TSP)是一种NP问题,在物流路线规划等领域有着广泛的应用。目前,研究人员提出了不同的算法来解决TSP,主要分为精确算法和启发式算法。由于精确算法设计复杂和求解时间长,启发式算法受到了广泛关注。在启发式算法中,蚁群算法是一种经典且有效的启发式算法,然而由于蚁群算法的参数不能灵活设置和局部启发信息不足等原因,算法容易陷入局部最优,因
学位
在中国,患者去医院就诊的第一步是选择科室进行挂号,科室选择的正确与否直接影响患者后续的就诊流程。然而,绝大多数患者缺少相关的医学专业知识判断自己应该选择哪一个科室进行挂号,而且随着我国人口老龄化的加剧,这一问题尤为凸显。调查研究发现,大多数医院通过设立导医综合服务台为患者提供科室选择指导,但由于看病人数远远多于导诊工作人员、导诊工作人员医学专业水平参差不齐等因素,导致服务台时常人山人海,患者没有得
学位
推荐系统旨在帮助用户寻找其感兴趣的事物(项目),正被应用到越来越多的互联网服务中。推荐任务通常可形式化为评分预测任务,即预测用户对候选项目的评分。基于协同过滤(Collaborative Filtering,CF)的推荐算法因其出色的性能成为推荐系统评分预测任务的研究热点,但目前仍存在以下问题:1)用户对项目的评分数据普遍偏少从而影响了推荐效果的数据稀疏性问题;2)根据用户最近的评分数据快速捕捉其
学位
国际疾病分类(International Classification of Diseases,ICD)是一种被广泛应用于疾病诊断编码工作的分类系统,其标准由世界卫生组织制定。在医疗实践中,人工ICD编码工作是易错且低效的,其中导致编码错误的最大原因之一就是合并编码情况没有被正确识别并处理。为了辅助编码人员进行编码工作,目前已经有不少关于ICD自动编码的研究涌现出来,但之前的研究都没有对合并编码给
学位
多旅行商问题(mTSP)是著名的旅行商问题(TSP)的延伸。多旅行商问题的目标是寻找一组哈密顿圈,其中每个旅行商都被派往一组城市而且保证每个城市只能访问一次。目前已经有一些致力于求解多旅行商问题的研究,但是大多数研究集中在如何最小化所有旅行商的旅行距离之和(即,minsum mTSP),只有很少的研究是专门针对以下两类复杂多旅行商问题:1.最小化所有旅行商的最大旅行距离(即,minmax mTSP
学位
膜计算是从活细胞的结构和功能中抽象出来的计算模型。该模型的进化规则执行具有不确定性和极大并行性。基于膜计算与进化计算相结合的膜进化算法将活细胞的生命活动抽象为进化算子,然后通过进化算子进化膜结构和膜内物质来求解优化问题。容量聚类问题(Capacitated clustering problem,简称CCP)是将无向图的顶点集划分为几个不相交的簇,使每个簇中的顶点权重之和满足容量限制,同时最大化同一
学位
由于Android系统的开放性,Android应用程序能够通过非官方渠道安装在Android设备上,这为智能系统带来了安全风险。因此,研究如何检测Android恶意软件是非常有必要的。目前,许多基于机器学习的Android恶意软件检测方法都以应用编程接口(API)为特征,具有检测效率高、准确率高等优点。然而,由于这些方法将API作为一个独立的整体特征,当API因Android系统的发展而发生变化时
学位
随着计算机视觉技术的发展,三维重建技术走入到人们生产生活中的方方面面。在众多三维重建的方法中,基于多视角图像深度估计的三维重建方法,是目前主流的三维重建方案之一。传统多视角图像方法使用图像的RGB信息来计算像素点的匹配代价,在弱纹理等RGB信息缺失的位置很难完成重建。随着近年来卷积神经网络在计算机视觉领域的发展,深度学习能够从图像中提取出更丰富的语义信息,将深度学习应用到三维重建领域逐渐成为了当前
学位
传统行人监控主要依赖视频分析、红外成像等方法,难以有效兼顾经济性、隐私性、可扩展性等诸多要求。近年来,因WiFi具备分布性广、信号普适性高、感知灵敏性强等特点,基于WiFi信道状态信息(WiFi-CSI)的无源感知方法逐渐受到学术界与企业界的广泛关注。然而,目前研究大多基于样本学习方法,往往存在以下两点不足:a)离线阶段样本采集开销大,b)跨场景条件下感知鲁棒性不高且可扩展性不强。鉴于此,本文深入
学位
视网膜是眼睛内部的重要组成结构,视网膜血管的异常变化与眼部疾病和部分全身性疾病息息相关。分析视网膜血管系统的特征不仅有利于疾病的诊断和治疗,而且对维护人体眼部健康和提高患者生活质量具有重要价值与意义。光学相干断层扫描血管造影(Optical Coherence Tomography Angiography,OCTA)是一种新型的、非侵入性的成像技术,在无需造影剂的情况下即可生成各个视网膜层和脉络膜
学位