面向大规模商品图像的高效检索方法研究

来源 :昆明理工大学 | 被引量 : 1次 | 上传用户:bbsdog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来以及移动互联网的普遍使用,电子商务行业得到了迅速的发展。商品图像检索作为电子商务的重要技术支持,得到了更多的关注。如何提升商品图像检索的速度和准确率以满足用户的需求亟待解决。经典的图像检索系统主要是基于文本信息的图像检索(Text-based Image Retrieval,TBIR)。然而文本数据信息具有一些难以解决的局限,很难准确描述出图像信息,且十分依赖用户输入的搜索关键词是否是准确的。相反的,基于内容信息的图像检索技术(Content-based Image Retrieval,CBIR)能够很好地解决这些问题,因为图像本身能够提供更多的信息。在CBIR中,是否能提取到具有区分性的图像特征直接影响了整个检索系统的性能。本文深入讨论了传统方法和深度学习方法在商品图像检索领域的相关研究,总结了面向大规模商品图像检索的研究现状。传统方法相对于深度学习方法具有难以描述全局信息、计算复杂度高、难以描述具体对象及无法考虑对象的空间位置等局限性。近年来深度学习表现出优越的性能,深度学习备受关注并迅速占领主导地位。本文基于卷积神经网络进行方法研究,研究内容是面向大规模商品图像的高效检索方法。面向大规模商品图像检索主要的技术难点有以下四点:1)庞大的数据规模。2)不同种类间数据量差异大。3)被拍摄商品的尺度相差较大。4)图像尺寸不一。针对大规模商品图像检索的难点,本文基于卷积神经网络设计了相应方法以完成快速且准确的检索。提出了融合金字塔池化策略与深度强相关哈希学习的SHN(SPP-HASH-NET)模型作为本文商品图像检索方法的特征提取部分。为了使学习到的哈希码更具有区别性,设计了强相关损失函数约束哈希编码;为了提高模型对商品图像形变的鲁棒性,采用金字塔池化策略实现多尺度特征融合;为了实现高效地商品图像检索,生成哈希码计算相似度。实验结果证明,采用本文方法能够直接利用原始图像信息,能够解决图像尺度变化所带来的负面影响,通过哈希编码能够实现快速的商品图像检索。在商品图像检索实验中,模型的训练时间小于其他模型,且模型的平均准确率均值达到91.52%,检索性能优于当前主流方法。
其他文献
21世纪是环保的世纪,降低汽油柴油中的硫含量已经成为一项迫切的任务。光催化氧化脱硫具有工艺简单、反应条件温和等优点,但是由于其存在光生电子空穴对复合率高、光响应范围窄等问题,所以主要集中在高活性的光催化剂的开发,其中采用负载型光催化剂,进行光催化氧化脱硫是一个研究热点。而芽孢杆菌由于的它的特殊结构组成即可以调节介孔分子筛孔道又可以改变载体的组成。本文通过以生物质芽孢杆菌为助剂合成SBA-15-W分
复杂系统可靠性分析方法一直是复杂系统领域的热门研究课题,对预防系统故障和人为失误的发生起到至关重要的作用。针对传统复杂系统人因可靠性分析方法存在前期评估标准不统一、无法准确描述系统元素之间的逻辑关联、无法直接服务于人机交互界面优化等缺陷,提出了基于复杂网络的人因可靠性分析方法。主要研究内容如下:首先,以典型的人机交互复杂系统——F/A-18C战斗机飞行驾驶系统为例,从人的认知加工角度出发,使用层次
本论文采用P123软模板制备方法,通过调控反应条件,制备中空结构的LaMnO_3钙钛矿型催化剂,探索其形成机理。通过调节温度、乙醇的量、柠檬酸的量、pH和模板剂调控产物的形貌,并用催化剂评价装置测试催化剂对有害气体NO+CO的催化活性。对形貌和活性进行比较,采用最优的实验条件,通过掺杂Sr、Ce、Eu和Cu元素,合成高活性的钙钛矿催化剂。论文第一部分的研究内容为调节不同的P123浓度制备核壳结构钙
能源问题是当今社会不可忽视的重大问题之一,除了不断开发新能源,还需要发展更为先进的储能技术。飞轮储能作为一种高效、方便的储能方式,已经在不同领域得到广泛的运用。近
2011年日本福岛核电站发生了核事故,产生了成吨的放射性废水。废水中主要的放射性核素是铯-137和铯-134。如何有效的处理大量的放射性废水,避免对环境造成污染和危害,是十分必要的。论文针对亚铁氰化物共沉淀浮选技术处理含铯放射性废液进行模拟实验研究。通过控制变量法,考察了不同的实验条件(表面活性剂浓度、沉淀剂浓度和溶气水流量)下,4种不同的亚铁氰化物对水中的铯离子去除率。实验发现铜离子、钴离子、镉
轮胎是车辆中典型的振动系统,能够吸收路面不平带来的冲击,直接影响车辆系统的舒适性、操纵稳定性及噪声。由于轮胎结构的复杂性以及车辆行驶工况的多变性,迄今为止还没有一个理论模型能够完全反映出轮胎在各个频段上的振动特性。因此本文通过建立考虑轮胎高阶弯曲振动的三维轮胎圆柱壳模型,研究轮胎在0-300 Hz低频及300-500 Hz高频段的振动特性。首先,基于Love圆柱壳模型建立三维轮胎物理模型,将胎面及
甲烷二氧化碳重整反应(DRM)具有良好的工业价值,它将难活化的甲烷与二氧化碳小分子气体进行反应转化,生成广泛应用于工业领域的合成气体即氢气和一氧化碳。此反应利用了 CH4和CO2这两种温室气体,消减了温室气体的排放,是温室气体利用和减排的最佳技术路线之一。同样这种方法所制取的合成气是H2/CO 比接近于1,它是可以直接在费-托合成上应用的。因此,甲烷二氧化碳重整反应具有科学的节能减排环保的研究意义
通过合成沉淀法简单地合成基于番石榴叶的镉-氧化锌(GCZ)纳米颗粒。将番石榴叶用作还原剂以制造纳米复合材料。通过傅里叶变换红外光谱和X射线衍射观察纳米复合材料的官能团和结晶性质。GCZ纳米粒子的光学带隙能量呈现较低的值(3.11 eV)。用扫描电子显微镜和高分辨率电子显微镜确认纳米粒子的表面形貌和微观结构。获得GCZ纳米颗粒的纳米粒径在20-50nm的范围内。GCZ纳米复合材料的光催化降解性能得到
随着信息技术的发展,大学生已经越来越离不开数字化学习,它一方面能增强师生间的跨时空互动,优化学习体验,满足不同学习者的个性化需求,另一方面也要求学习者能熟练地将技术
近年来,钛铌氧化物作为锂离子电池的负极材料所表现出来的优秀性能引起了人们的广泛关注。但是,由于其电子导电率低,这些化合物在实际应用中也受到很大的限制。在本文中,我们通过静电纺丝的方法成功地合成出来具有不同形貌的CrNb49O124纳米纤维,CrNb49O124有着和钛铌氧化物类似的优点(比如理论比容量高,平台范围相似),但相比于钛铌氧化物,它有着更高的电子导电率,这也使得CrNb49O124展现出