基于深度学习的特征描述符学习算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:zjjsdsxq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征匹配作为计算机技术和人工智能中一项基本的图像处理技术,在许多计算机视觉应用中都扮演着关键的角色,比如图像检索、图像配准、三维重建等。随着计算机技术和人工智能在人类日常生活中日益广泛的应用,人类对特征匹配技术的有效性、稳定性和泛化能力都有着更加迫切的要求。在特征匹配过程中,如何确定两个特征属于同一目标是非常困难的,特别是在匹配特征在外观上非常不相似,而非匹配特征又特别相似的情况下。因此,设计一个高质量的特征描述符就显得至关重要。相对于手工设计的特征描述符,基于学习的特征描述符通常可以适应更加复杂的场景,因此这类方法也是目前研究的重点。本文研究了基于深度学习的特征描述符学习算法,旨在实现同一特征的高效和精确匹配。本文的主要研究工作如下:1.本文分析了现有主要的特征描述符学习方法,根据描述符的表示类型将其分为实值型和二值型;根据学习方法将其分为基于手工设计的方法和基于学习的方法。基于不同的分类方法,本文详述了各类方法的特点和原理,并介绍了各类方法的代表算法。2.提出了一种基于网络融合的描述符学习方法。受到传统融合算法的启发,本文提出了网络融合框架来学习描述符。根据设计的框架,提出数据增加的方法产生新的样本参与训练。鉴于三元组损失函数在匹配任务上的优势,本文通过最小化三元组损失来训练模型。此外,为了更好地训练模型,本文采样困难负样本挖掘的方法获取三元组中的负样本,进一步提高了算法的性能。3.提出一种基于自编解码结构的描述符学习方法。考虑到实际应用中描述符的维度有限,本文尝试使用相同维度的描述符携带更多的原样本的信息。通过构建解码器网络,从描述符中恢复原图像。计算原图像和重构图像间的重构损失,最终迫使描述符携带更多的原图像信息。算法最终在两个标准数据库上进行评估,实验结果表明了本文算法的优越性。
其他文献
2004年,石墨烯的成功制备掀起了人们对二维纳米材料的广泛关注。大量研究发现二维纳米材料具有很多优异的电学性质和磁学性质,被预言可以应用于太阳能电池、集成电路及自旋器件等光电子领域和纳米器件领域。近几年来,随着人们的深入研究,二维纳米材料更多更优异的物理化学性质被人们所证实,其中以类石墨烯六角蜂窝结构为代表的二维纳米材料尤其引人注目,它们在理论和实验上已经获得了丰硕成果。对类石墨烯结构纳米材料的研
随着高速信息技术(如5G)的迅猛发展,我们逐渐进入人工智能时代,各种通信技术在不断升级和提速扩容,直接推动了传感技术的进步。智能时代依赖众多传感器将万物互联并形成下一代网络----物联网,从而将深刻改变人们的生活和思维方式。光波导传感器属于众多传感器中的一种,具有其独特的优势,是光网络中必备的传感器。本文将主要研究平面多层光波导气体传感器及其检测气体的灵敏度,通过研究为后续实际应用的可行性做准备。
粗糙集理论是处理不精确性和不确定性问题的一种工具,其从单粒度的角度描述目标概念,具有一定的局限性。而多粒度粗糙集通过多个二元关系从多个粒度来分析问题,能够处理更为复杂的信息系统。此外,基于双量化方法的粗糙集自提出以来,由于其综合考虑了相对和绝对量化信息,能够提高近似分类精度,在不确定性决策问题中受到了广泛的关注。三支决策理论对粗糙集中的粗糙域提供了合理的语义解释,并同时考虑了决策风险,使之成为不确
生物医学文本领域每年产生大量的文献、病例,这些材料中往往包含重要信息,但依赖人工处理不仅工作量巨大,并且难以保证效率。近年来,随着自然语言处理的不断发展,深度学习已经取代传统统计学方法,逐渐成为各领域的主流方法。利用深度学习技术对生物医学文本进行信息提取,一方面可以有效提高提取效率,另一方面,深度学习强大的特征学习能力能捕捉更多人工难以识别的特征,提高识别精度,强化提取能力。这对于生物医学领域发展
人们对于更大的硬盘驱动器的存储容量的日益增长的需求,推动了人们对这方面的关注和广泛的研究。在上个世纪末研究者发现了巨磁阻(GMR)效应,几年后就研究得到基于氧化铝的磁性隧道结(MTJ)。MTJ是一种不同于其它类型的磁性存储器,它是自旋电子学领域的有研究前景的纳米结构器件。MTJ具有很高的隧道磁阻(TMR)效应,体现在存储容量、速度和稳定性方面有很大的优势,另外由于是纳米器件,它的尺寸会比之前的存储
随着社交网络的快速发展以及用户的广泛参与,网络中产生了日均千万级的文本数据,其中包含了大量公众对热点事件的观点与态度,以及用户对产品的体验等。对这些含有丰富情绪信息的文本数据进行挖掘与分析,识别、理解其中包含的情绪信息,具有很高的社会价值与商业价值,引起了学术界和产业界众多研究者的广泛关注。网络文本具有口语化和不规范化的特点,这使得情绪分析工作面临很多挑战。在词嵌入表示方面,现有模型大多采用Wor
随着计算机视觉的迅速发展,3D成像技术在工业检测、医疗卫生、安全防护、虚拟现实和3D打印等领域得到了广泛的应用。本文研究的3D成像装置,以小柱状芯块为目标,实现对其外观质量的检测。3D成像装置采用纯色LED线结构光与面阵相机相结合的方式,对芯块的外观进行扫描。通过设计双滚筒机械装置,带动芯块旋转,从而实现对周面的结构光图像进行采集。通过设计电动滑台装置,带动芯块定向匀速移动,采集芯块端面的结构光图
复合材料作为一种新兴材料,凭借其强度高、重量轻、隔热性好等优良性能,近年来被广泛应用于工业生产的各个领域。但其在加工制造及使用时,可能会产生脱粘、孔隙等缺陷问题。这些问题会使复合材料性能快速下降,最终影响材料的可靠性。尽管破坏性试验检测法可以较好地完成材料的质量检测,但其破坏了材料的结构,因而只能抽样检测,无法实现在线实时检测。因此,应用先进的无损检测技术实现对材料缺陷的检测与判定,具有重要的现实
姿态作为重要的导航参数,随着智能驾驶、无人机和无人车等技术的兴起,得到了越来越多的重视。在基于不同传感器的测姿技术中,GNSS测姿具有全天候、精度高和误差不随时间累积的优势,但在挑战环境下,测姿精度、连续性和可靠性会迅速降低。MEMS惯性(简称MEMS)测姿则具有低成本、体积小,自主无源的优点,将GNSS与MEMS两者进行信息融合可实现优势互补,获得更好的测姿结果。根据GNSS天线的数量,GNSS
数字隐写技术是保障通信安全的重要手段,但也为恶意的非法通信提供了便利。隐写分析技术作为隐写术的对抗手段,其目的是检测信号中是否嵌有秘密信息,在这个注重信息安全的时代具有重要的研究意义。数字音频是人们生活中常用的数字媒体之一。音频应用与音频处理软件的普及极大地促进了音频隐写和隐写分析技术的发展。在复杂的大数据取证场景下,音频数据通常具有多样性和复杂性,攻击者使用的载体数据模型和隐写算法通常是未知的,