基于深度学习的立体对象识别与检索方法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:wsdadoudou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维视觉技术是计算机视觉领域中的一个重要方向,立体对象识别和检索任务是三维视觉领域中的一个重要的研究领域,被广泛的应用于自动驾驶,虚拟现实/增强现实,游戏,产品设计等应用领域。如何从立体对象数据中获取高质量的立体对象特征表示在识别和检索中具有重要的作用。对于立体对象的多视图数据,视图之间存在着一定相似性或差异性的关系,如何合理的利用视图的关系进行合理的建模值得被进一步的研究。当前的研究工作大多关注如何从单个立体对象的数据中尽可能的获得高质量的立体对象特征表示,但是立体对象的检索是在对象空间中寻找相关的对象,因此在学习立体对象特征表示时,如何将对象空间中的复杂关联充分的挖掘和利用起来也是非常重要的。另外,搭建可用于立体(3D)对象识别和检索的软件系统也具有非常重要的意义。因此,基于以上提到的一些问题,本文开展了基于深度学习的立体对象识别和检索方法研究,本文的主要研究内容和具体贡献可概括如下:(1)为了能够更好地利用和挖掘立体对象多视图数据之间的关联关系,得到更好的立体对象特征表示进行识别和检索,我们提出了一种基于多视图高阶关联的立体对象识别和检索方法。方法中超图和多视图超图卷积被设计用于多视图关系的建模和视图特征提取,整体网络结构通过视图节点池化过程逐级的实现立体对象特征的提取。我们进行了立体对象识别和检索实验,证明了该方法的有效性。(2)我们提出了一种基于多尺度超图神经网络的立体对象识别和检索方法。在该方法中,通过超图构建立体对象之间的相关性,设计了超图神经网络去学习和利用立体对象之间的高阶关联实现对象特征的联合优化。该方法还引入融合模块,将不同尺度上的特征进行融合以获得更高质量的立体对象特征表示。我们在公开3D数据集上进行了识别和检索实验验证,实验结果表明该方法相比于该领域内的前沿方法在性能上有显著提升,证明了该方法的有效性。(3)基于本文的算法研究我们设计了一套可用于立体对象识别和检索的软件系统,该系统被称为立体对象分析系统。该系统通过软件可视化交互的设计,可以进行算法智能化的立体对象识别和检索,同时拥有视图数据和立体对象的可视化显示、运行算法选择等功能。该系统主要使用图形用户界面(GUI)框架PyQt和深度学习框架PyTorch技术搭建而成,对硬件的要求低,可移植性强,使用方便快捷。该系统也进一步验证了本文提出的算法的有效性。
其他文献
舌诊是中医学望闻问切中的望诊的重要组成部分,舌象中的齿痕特征是指舌体的边缘能够看见牙齿的痕迹。齿痕舌是对脾气虚证进行诊断的重要客观指标,对这一指标进行识别能够促进中医对症状的分化和治疗选择。因此,部分研究人员尝试将舌体从舌图像中精细化地分割出来,以此服务于后续的中医舌诊的自动识别研究。然而,齿痕舌图像的分割极具挑战性。齿痕可被分为轻度、中度与重度,不同的齿痕程度对应于不同的脾虚以及湿重的程度,体现
学位
创新经济学认为,创新是推动经济可持续增长的最终手段,随着研究视角从古典经济学逐渐转变到创新经济学,企业技术创新活动及其形成机制得到越来越多的关注。技术、环境和地理空间复杂性的日益增强使得企业已无法单独应对技术快速进步和环境多样性变化的挑战,需要跨越企业边界与其它的主体进行合作,即开放式创新。在互联网时代,开放式创新的重要表现形式之一为互联网开放式创新社区。互联网开放式创新社区中,用户为产品的改进和
学位
微生物检测在食品安全,环境卫生以及抗生素耐药性检测领域具有重要作用。应用于抗生素检测的微生物检测是通过检测抗生素浓度作用于标准菌液的增殖情况,间接评估抗生素作用效果,还可放大微剂量微梯度下的抗生素抑菌效果,适用于长期低阈值水平下抑菌效果的跟踪评估和分析。基于不同的发生机制,微生物的检测方法多种多样,但目前还没有同时满足快速检测和现场检测的传感器,对于大批量样本检测也存在弊端。因此,本文以大肠杆菌为
学位
近年来,随着大数据和云计算的出现,时序数据成为最普遍的数据形式。时序聚类是一种主流的数据挖掘技术,根据对象是时序数据集还是单条长时序数据,可以获得不同的聚类结果。其中,时序聚类的关键问题是如何更好计算时序之间的相似性。已有文献对相似性度量存在大量改进或是将大量的聚类方法应用到时序数据中,但是未曾指出导致相似性度量效果差的原因以及无法利用相似性进行合理聚类,导致聚类效果并不理想。因此本文提出了一种改
学位
随着科技的进步,计算机视觉技术的发展,人类生活已经进入了信息化的时代。同时,海洋的建设与发展也亟需转型升级、与时俱进。借助信息技术构建智慧海洋将是未来重要的研究方向,对海底资源探索和开发具有重要意义。其中,水下图像增强技术作为人类探索水下世界的眼睛,是进行水下勘探的第一步,而水下目标检测技术也是实现海洋牧场捕捞和海洋生物监测的重要手段。如何克服并适应水下环境的特殊性,是本文研究水下图像增强和轻量级
学位
随着信息技术的快速发展,全球贸易结构发生了巨大的改变,而离岸服务外包也异军突起,迅速成为国际贸易中必不可少的一部分。离岸服务外包的发包企业多为享誉全球的跨国公司,他们在选择承接企业时,除了会关注企业本身的质地,也会考虑接包企业所在国家或地区的政策支持情况。如今全球技术进步迅速,先进的技术往往能够给一个产品带来相当高的溢价,因此世界各国对知识产权保护愈发重视,市场竞争环境是否公正、知识产权保护制度是
学位
金线莲是我国民间特有的食药兼用型名贵中药材,具有除湿祛风,固血保肝的功效。目前市场上的金线莲种源混杂,品质参差不齐,且存在以假乱真、掺假售假等现象。近红外光谱分析技术有着高效、简单和绿色等优点,在其它中药材的品质检测上都得到较好的应用。本研究将不同品系的烘干金线莲及其伪品血叶兰、斑叶兰作为主要研究对象,利用近红外光谱分析技术,对金线莲的真伪、品系及黄酮类成分含量展开研究,并在此基础上构建定性或定量
学位
图像是当今社会人类获取信息的重要途径,而图像复原技术是图像处理领域重要的组成部分。图像去模糊技术作为图像复原技术中的核心技术之一,针对解决因图像模糊问题造成的图像质量退化现象,一直被广泛研究。图像去模糊问题属于不适定问题,处理的难度较大。由于图像模糊受场景深度,拍摄画面中物体运动等因素影响,运动模糊是非均匀的。针对解决非均匀图像模糊问题,在本文中,提出一种改进现有去模糊网络的方法,利用像素级模糊程
学位
苹果是我国的第一大水果,栽培面积和产量均居世界首位。调查显示,我国苹果面积、产量占世界的50%以上,均居世界首位。苹果内在含有多种高营养价值的物质,其中,苹果内含有的黄酮类化合物对人体健康发挥着举足轻重的作用。目前,对于苹果内黄酮类化合物的检测手段主要通过化学有损检测的方法进行,该方法不仅成本高,还因为繁琐的检测流程需要投入大量的人力物力。因此,需要一种能够快速无损且成本较低的检测方法,以便携式、
学位
卒中病发是造成人类死亡的主要疾病之一,并且患者在接受治疗后仍会存在严重的后遗症。目前传统的诊断方法依赖于医学影像信息,并且需要具有熟练技能的医生来对患者的状况进行诊断确认。同时,医学影像成像本身耗时久,医生和患者之间难以达到信息的有效沟通。机器学习等前沿技术能够在降低人为干预的情况下以医学影像为主要依据来自主判断患者卒中情况,因此可以通过引入计算机辅助系统帮助医生提升卒中诊断效率。本文在心电图信号
学位