基于深度学习的三维模型识别技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:mihu0907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能多媒体技术的发展,三维模型被广泛地应用在智能建筑、生物建模、医学诊断等领域。三维模型能更形象地表示物体、贴近人类对现实世界的感受,但其数据处理过程相对复杂。作为三维模型研究领域的热点之一,三维模型识别旨在学习三维模型数据的特征表示、理解三维模型的内容。三维模型可由不同模态数据表示,如点云、多视图等。本文以有效融合点云和多视图两模态特征表示为目标,开展了基于深度学习的三维模型识别研究。本文提出了一种注意力引导的点云-多视图三维模型识别方法,该方法综合考虑点云和多视图数据的优势,在注意力机制的引导下对两种模态特征进行增强和融合。首先,基于两种模态数据提取的初步特征,设计了模态间注意力增强模块,在注意力机制的引导下,挖掘模态间的相关信息,对两种模态的特征分别进行优化和增强。然后,设计了视图上下文注意力融合模块,进一步挖掘视图序列中包含的上下文信息,并对特征进行自适应融合,提高最终三维模型特征的表征能力。在广泛使用的公开数据集上的实验结果表明,所提出的方法获得了良好的三维模型识别性能。本文还实现了一种基于对比学习的无监督点云-多视图三维模型识别方法,该方法构建了一种基于对比学习的无监督训练机制,用于对多模态特征增强与融合模块进行训练,以获得具有辨析力的三维模型特征表示。首先,对点云和多视图模态的特征提取单元进行无监督预训练,分别获得两种模态数据的特征表示。然后,基于对比学习对多模态特征增强与融合模块进行无监督训练,以挖掘模态特征间的关联信息,对两模态特征进行增强。同时,采用提出的模态池化操作对增强的点云和多视图特征进行融合,得到更具辨析力的三维模型特征表示。最后,通过在公开数据集上的实验,验证了所提出方法的有效性。
其他文献
随着无人技术的发展,水面无人艇在水质监测、海底勘测、海上巡航和海上运输等方面的应用越来越广。为保证水面无人艇在完成任务过程中的安全航行,开展路径规划研究具有十分重要的意义。为了研究动态海洋环境下无人艇的路径规划问题,本文根据电子海图水深数据和潮汐数据构建动态环境模型,为路径规划提供基础条件。在规划分析阶段分成全局动态路径规划和局部路径规划两步进行:在全局动态规划中,用改进的LT-D*Lite算法进
学位
脑静脉窦血栓为脑血管疾病,是由于各种原因导致的脑静脉系统狭窄及闭塞,患者颅内静脉回流受阻,导致颅内压增高,其发生率占所有脑卒中的1%。由于脑静脉窦血栓发病早期临床症状缺乏典型性,且患者发病后并不会引起脑室扩张,亦不会引起脑积水,导致临床诊疗难度较大,亦影响患者治疗预后。数字减影血管造影(DSA)检查是脑静脉窦血栓患者临床诊断的“金标准”,检查可靠性高,但其存在一定风险,还具有创伤性,导致患者的耐受
期刊
随着三维点云在自动驾驶、虚拟现实、机器人导航等领域的应用,三维点云重建任务受到了研究人员的广泛关注。三维点云重建旨在从单张或多张视图中重建出所包含物体的三维点云模型。本文在深入分析三维点云重建关键问题的基础上,以提高三维点云重建精确度为目标,基于深度学习开展了单视图三维点云重建技术和多视图三维点云重建技术研究。本文实现了一种深度图辅助的单视图三维点云重建方法,利用从RGB图像中估计的深度图作为辅助
学位
在构建智能电网的时代背景下,作为电力系统经济调度的根本出发点,精准的负荷预测是电力系统高效运作的重要保障。因此,本文对电力负荷的短期预测方法进行了对应的研究。鉴于负荷序列的周期性与强时序性,本文选择长短时记忆(Long Short-Term Memory,LSTM)网络用于电力负荷的短期预测,但LSTM网络参数初值的随机设定容易导致其预测性能起伏变化,故本文提出一种改进的麻雀搜索算法,利用该算法对
学位
细粒度图像具有类间差异小,类内差异大的特点,如何提取具有高辨识度的细粒度特征是解决细粒度图像分类问题的关键。小样本学习旨在通过一张或几张实例来学习和理解新的类别,但由于训练样本数量有限,很难学习到有效的特征分布。因此,开展基于小样本学习的细粒度图像分类技术研究,旨在通过有限的样本学习细粒度图像特征,进行图像分类和识别,是一项非常具有挑战性的任务。现有研究范式针对小样本条件下细粒度图像分类网络表征能
学位
高动态范围(High Dynamic Range,HDR)图像相比于标准动态范围(Standard Dynamic Range,SDR)图像,在单通道上使用更多的比特数来记录灰阶的变化,使记录的场景中明暗区域细节的可见性都有极大的提升。在目前HDR显示器还未普及的情况下,色调映射算子(Tone Mapping Operator,TMO)可以将HDR图像转为SDR图像,使HDR图像所记录的场景效果能
学位
随着新材料技术和仿生电子学等学科的飞速发展,在小尺寸区域达到高空间分辨率的测量能力成为仿生触觉感知技术需要不断提高的难点之一。以光纤作为传感元件的光纤传感技术因具有系统易于搭建、成本低、灵敏度高、探测范围广、不需额外供电和不受电磁干扰等优点,使其近些年成为重点的研究方向被广泛应用在物理、化学和生物医学等学科领域。本文以PMMA-CFBG为传感元件,提出了一种高空间分辨率的分布式传感方法并进行了理论
学位
人体姿态估计是计算机视觉任务之一,在安防监控、动作识别和动画等领域具有广泛的应用前景,近年来逐渐成为研究热点。相较人工提取特征的方法,基于深度学习的人体姿态估计方法具有更强的特征提取能力,已成为姿态估计任务的主流研究方向。当前姿态估计算法性能已达到较高水平,但是许多高精度算法依赖复杂的神经网络结构,存在计算成本高、延时大的问题而难以做到实时检测,所以需要设计更轻量的网络。本论文主要工作如下:第一,
学位
基于深度学习的智能无人系统以其高智能、小型化、低成本等优势被广泛应用于各类暗光场景。而高级的计算机视觉任务,如目标检测,通常以内容清晰的高质量图像作为研究对象,对环境复杂、光线微弱的暗光场景无法实现高精度的检测。为此,本文提出了一种融合注意力机制的暗光增强算法以及适用于移动设备的快速目标检测算法,并通过级联的方式解决了暗光检测问题。此外,为了验证算法的可行性,本文还搭建了无人车实物平台,实现了对暗
学位
近年来,随着计算机视觉采集技术及三维建模技术的快速发展,三维模型因其空间信息直观、承载内容丰富,逐渐被应用于各个领域,如建筑模型、医疗模型、游戏模型等。三维模型数据的海量增加对数据的智能管理带来了极大挑战。面对海量三维模型数据,如何实现高效地查找和复用成为业内一个亟需解决的问题。本文在对目前主流的三维模型检索和分类算法进行充分调研的基础上,针对三维模型多视图信息的表征,从自监督和无监督方面完成了以
学位