基于CNNs的大规模复杂图像检索算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:sqm_crscd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大量的视觉数据通过互联网不断产生,尤其是社交媒体平台和其.他存储库的流行,使人们对视觉内容的兴趣迅速增长,也为基于内容的图像检索CBIR(Content Based Image Retrieval)带来了新挑战。CBIR实现了在各种图像数据库中进行相似内容搜索,在工业界有着广泛的应用场景,如搜索引擎(Google、百度)的以图搜图功能,电商网站(淘宝、Amazon、eBay)的相似商品搜索,社交平台的相似内容推荐等。作为一个相对成熟的研究领域,CBIR应用于大规模图像实时检索时,在效率和准确性方面仍具有众多可持续改进之处。近期,将人工智能Al技术与CBIR技术相结合,显著地改进了基于内容的图像搜索的性能,这使得基于多功能数据集,采用深度学习的智能高效图像检索研究成为近期的一个研究热点。AI与CBIR技术的融合,如何应用深度特征嵌入和图像索引限制是面临的重要挑战。首先,现有的研究方法在算法融合的复杂性、集成建模、性能和资源处理等方面存在局限性。其次,使用卷积神经网络CNN(Convolutional Neural Network)的综合图像检索脚本,并没有明显改善精度和召回率。最后,图像的可解释性并没有利用区分相似图像组的微小变化而获得增强。因此,为解决这些问题,本文提出了一系列新颖的融合方法,针对大规模数据集下的复杂图像检索问题,采用多层深度学习卷积神经网络嵌入这项重要技术,通过结合原始的局部和全局特征改进了图像检索的过程。此外,本文还给出了特定领域搜索和检索的时间复杂度,并通过基准实验证明了所提方法均改善了检索的精度和效率,优于同一领域现有的研究工作。本文的核心贡献包括以下几点:1.提出了一种基于CNN的对称性、缩放和空间集成的图像提取方法,以一种新颖的方式检测显著对象、空间颜色和纹理特征,用于准确地表示图像内容,并将它们与ResNet架构提取的特征相结合。首先,该模型应用对称采样、平滑和面向缩放的签名来识别深度图像特征。其次,过滤、缩减、基于加速分段测试(FAST)分数的抑制和特征缩放的特征被用于调整具有挑战性的数据集的特征;进一步,采用对称采样、特征子采样以及最终通过应用主成分分析(PCA)可在低计算负载的情况下进行快速的特征提取和用户响应。出色的实验结果证明了所提模型与当前相关研究相比具有优势。2.提出了一种基于深度学习的各向同性、相互绑定和映射的大规模图像检索方法,将VGG-19、ResNet-50和GoogLeNet模型与显著性锚点收集和检测框架相结合,以提高大型数据集的图像检索效率和准确性。该创新的深度学习解决方案在框架封装、特征绑定、与分层的原始特征融合、深度特征定向以及CNN对显示的局部和全局签名的类型化效果方面取得了突破。该方法首次将特征值和插值绑定与CNN一起使用,以提高准确性和改进性能;使用了拉普拉斯定理和归一化映射评估行列式来创建对应关系;使用了不同的缩放级别来获取背景和前景对象的信息。实验结果表明,所提出的方法在所选数据集的大多数语义组中均获得了超过88%的最高精度结果,优于现有方法。3.提出了一种用于复杂内容检索的深度融合CNN框架,将四种巨型架构(DenseNet、VGG-19、ResNet-50 和 GoogLeNet)与创新算法相融合,使用可扩展的、参数化的、融合的和架构密集型的方法,用于识别、检测和智能分类深层、原始、杂乱和重叠的特征。该框架应用不同缩放技术在多个抽象级别上得到深度图像过滤,同时处理由高斯推导和定长递归形成的后续积分,通过在最小化边缘处与熵一起累积,将这些边缘分类为阈值化矢量,这是与本文所提出的第二个模型的主要区别。在RGB颜色通道上执行图像通道以收集系数,并在这些颜色通道上应用L2范数,结合生成的签名来简洁地表达大量的特征向量。基于DenseNet、GoogLeNet、VGG-19和ResNet-50的特征向量与提取的深度特征相融合,被用于查找复杂图像、纹理图像、杂乱图像、颜色主导图像、形状主导图像、边缘主导图像、重背景图像、简单图像、形状主导图像和空间图像。该模型同时适用于小型和大型图像数据集。所提方法在具有挑战性的1 1个基准上进行了测试,并获得了出色的结果。
其他文献
随着中国对外开放进程的不断加深,关税水平的不断下降,进出口贸易额呈飞速增长态势。与此同时,中国的减贫事业也有了重大进展。按照“2010年”贫困标准,中国的贫困发生率由1978年的97.5%下降至2017年的3.1%,减贫人口达7.4亿人。2020年现行标准下的农村贫困人口实现了全面脱贫。毫无疑问,中国对外贸易发展和减贫都取得了巨大成就。对外贸易是否会对贫困产生影响?由于各个国家和地区的经济政策和市
学位
二维层状过渡金属硫属化合物(TMDs)是一类十分独特的功能材料,在能源和催化等众多领域中具有广泛且重要的用途。超薄的TMDs因维度急剧减小,比表面积和活性位点增加可有效提升其性能和应用范围。其中的硒化物因成键和生成自由能与对应硫化物的差异,会表现出更为丰富的结构和性能,更具应用前景。然而硒化物等TMDs的传导性能差在很大程度上局限了其应用。为此本博士论文将重点以硒化钨(WSe2)基等异质纳米材料为
学位
图兰问题是极值图论的核心,它研究在给定条件下(不含某种特定的子图)最大可能的边数.这类问题中最基本的、同时也是研究最早的问题之一是关于4圈的问题.研究4圈对图兰问题,尤其是退化类问题的发展有着重要的启示作用.这篇文章主要研究4圈的极值问题,特别是两个著名的猜想:一个是Erd(?)s在上世纪七十年代提出的猜想,说ex(n,C4)=1/2n3/2+1/4n+o(n).另一个是Erd(?)s和Simon
学位
作为近代藏族史上颇为关键的一位历史人物,吴忠信最令人记忆深刻的事迹便是曾代表国民政府会同西藏摄政热振呼图克图主持了十四世达赖喇嘛转世事宜,从而有力地维护了中央政府对于西藏地方的国家主权。吴忠信从1936年开始担任蒙藏委员会委员长,一直持续到1944年,共计八年时间。可谓蒙藏委员会历史上担任委员长时间最长的一位,约占整个国民政府蒙藏委员会总存续期间的三分之一还强。这一时期,正是西藏历史上最复杂、最曲
学位
小型模式生物如秀丽隐杆线虫、果蝇和斑马鱼是常用于研究遗传学、神经科学和疾病发展的理想模式生物。通过研究模式生物人们可以从细胞、组织、器官和系统层面全面解析生物系统。由于在物种进化上的保守性,这些模式生物与高等生物有相似的基因结构和功能,常用于遗传学、发育生物学和神经科学等研究领域。无标记光学显微镜如被生命科学工作者大量使用的体式显微镜,目前只能对小型模式生物进行宏观分析。要想对其进行细胞或者亚细胞
学位
开展青少年法治宣传教育是推进中国特色社会主义法治体系建设的重要手段和渠道。随着社会经济的快速发展,青少年法治宣传教育的开展也应顺势而为,迎风而上。初中生作为青少年主要群体,正处于认知发展的“拔节孕穗期”、人格发展的“黄金关键期”以及社会性发展的“成长适应期”,是法治观念形成的关键人物。要下大气力找准法治观念培育的合适着力点,引导初中生树立正确的法治价值观。2022年5月,义务教育阶段课程标准(20
学位
口服抗生素是目前最常用及有效的治疗多器官细菌性感染的方法。然而,在口服抗生素治疗过程中,部分未被肠道吸收的抗生素会到达盲肠和结肠区域。这两个区域中存在着丰富的肠道菌群,这些共生微生物影响诸多生理过程,并参与免疫和代谢稳态的调节。未被吸收的抗生素会对盲肠和结肠的肠道菌群产生极大的干扰,诱发一系列疾病:包括改变肠道菌群基本的生理稳态,诱发宿主更易感染机会致病菌,造成急性肠炎;改变菌群结构,影响免疫细胞
学位
超势垒整流器(SBR:Super Barrier Rectifier)利用 MOS(Metal-Oxide-Semi conductor)结构形成的可调节的电子势垒来实现器件的开合,其开关速度和正向压降可以媲美肖特基整流器,又因为摒除了信赖性较差的肖特基接触而提高了反向漏电流和击穿电压等方面的表现,满足了高频电力电子电路中对兼具高反向击穿电压、小反向漏电流、低正向压降、高开关速度的器件设计要求。相
学位
为了满足空间多元化数据的高速传输需求,本文对SpaceFibre高速总线网络进行了研究,针对路由网络中的数据转发冲突,提出了一种SpaceFibre路由系统设计方案.其中,配置端口实现了网络参数的实时配置和状态的实时反馈;路由端口实现了基于虚拟通道机制的QoS调度,为不同数据源提供不同服务;路由交换模块中利用全连接结构实现了虚拟网络间的互联,并针对虚拟网络中的数据交换冲突,设计了一种基于优先级等待
期刊
极值图论最早的一个定理是由Mantel在1907年提出。他证明了n个顶点且不包含三角形作为子图的边数最多的图一定是K[n/2],[n/2],一个两部分大小尽可能相等的完全二部图。1941年Turan将这个定理推广到了不包含一般的t-团(t个点的完全图)作为子图,证明了对给定顶点数目且不包含t-团作为子图的边数最多的图一定是每两部分大小尽可能相等的(t-1)-部完全图。由于Turán的开创性工作,对
学位