熵在图像检索领域的应用算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:X5203344
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网技术的蓬勃发展,各种社交软件走入了我们的生活,每天我们都需要接触各种形式的多媒体信息。如何快速、准确地捕捉到其中的信息,对其进行有效的利用成为一个重要的研究课题,引起学术界的广泛关注。在这种趋势下,图像检索技术得到了充分又全面的发展。早期的图像检索是基于图像文本标签的。这种方法存在两个主要问题:第一,使用的图像需要经过人工的文本信息标注,这显著增加了物质成本和时间成本;第二,在背景更复杂的图像中,仅依靠人工标注不能准确地表达出图像的主要信息。因此,在后续的研究中基于内容的图像检索(CBIR)很快就取代了基于文本的图像检索(TBIR)。CBIR不再依赖人工标注,它通过算法自动地分析图像的主要内容,生成图像描述子。它主要有两个发展阶段:起初,CBIR主要依靠BoW、VLAD、Fisher Vector等手工设计的特征。经过高斯卷积、局部特征聚合、归一化等处理,这些特征具有良好的稳定性,并且易于计算。现阶段,得益于GPU计算能力的大幅度提升,基于深度卷积网络的图像检索算法成为了主流。在硬件支持下,卷积网络的层数持续增加,网络的种类也更加多样化。无论是传统的图像检索算法,还是基于深度卷积网络的图像检索算法,都采用了计算描述子之间欧式距离的方式衡量描述子的相似度。在本文的研究中发现,仅通过欧式距离描述特征之间的差别是不够充分的。对于一组相互匹配的特征点,只需改变特征的分布状态,它们的相似性就会被破坏,而欧式距离是无法捕捉到这种变化的。基于这种理论,本文分别提出了空间分布熵(SDE)和分布熵增益损失函数。空间分布熵把描述子的分布状态添加到了图像描述子当中。而分布熵增益损失函数则在网络训练过程中强调了特征之间分布状态的差别。综上所述,本文取得以下的研究成果:1.本文提出了使用空间分布熵表达图像中局部特征空间信息分布状态,提高图像描述子的准确性。每幅图像都从空间坐标、尺度和方向这三个方面统计局部特征的空间分布状态,生成频率分布直方图,计算空间分布熵。空间分布熵在经过归一化之后与图像描述子拼接在一起,就得到空间分布熵改进的图像描述子。空间分布熵既可以应用于传统图像描述子又可以应用于深度卷积网络的图像描述子。本文通过图像检索、图像分类、海量图像检索等多方面的实验证明了空间分布熵的作用。2.本文提出了分布熵增益损失函数。现阶段,深度卷积网络(CNN)已经在图像检索公开数据集上实现了很高的检索准确率。想要在此基础上进一步提高准确率,图像描述子需要在相似度很高的图像中捕捉到一些细微的差别,同时又能够轻易的分辨出不属于同一类别的图像。本文提出的分布熵增益损失函数保留了对比损失函数中计算图像之间欧式距离的部分,同时新的损失函数还在图像特征之间计算了分布状态的差别,最后把这两部分相加就得到了分布熵增益损失。通过充分的实验验证,分布熵增益损失函数提升了CNN图像检索的准确率。
其他文献
随着集成电路技术的发展,当前的芯片会出现在工艺、电压、温度以及老化等方面的偏差(Variation),在低电压尤其是超低电压下偏差将变得更加显著。这种偏差会使得当前集成电路
研究目的:慢性下背痛(Chronic Low Back Pain,CLBP)老年人腰椎-骨盆协调能力下降、腰背部肌力不足、下肢活动受限等问题,会导致CLBP患者行动能力变差、平衡受损、姿势控制障
基于谐振原理的微悬臂梁式质量传感器以其高分辨率,高稳定性,易集成等优点成为了近年来国内外的研究热点。但由于工艺及检测环境等条件的限制,很难在结构尺寸一定的情况下进一步实现痕量物质的精确测量。因此,本文拟通过非线性耦合传感新方法实现谐振式悬臂梁质量传感器灵敏度及分辨率的提高。针对非线性耦合梁结构在不同尺度下传感特性的差异,适应阵列大量制造及低成本小批量制造等不同市场需求,创新性的提出了基于同步共振原
山体雕塑作为推进中华优秀传统文化传承发展的楷模,其发展历程几乎同步于人类文明的进步,展现了中华儿女绵绵不断的人文情怀。从一个个伟岸的雕塑形象中,人们不但了解了国家
在超导瞬变电磁法的测量中,实测数据中常会出现极化效应,无法利用电磁-极化数据直接计算视电阻率值,这会使电阻率反演结果无法准确分辨矿体位置。因此,为反演结果更加准确,得到更丰富的地下异常体信息,极化效应必须被重视,极化效应的特征主要与零频电阻率、充电率、时间常数和频率相关系数等四个极化参数有关,所以极化参数的提取具有重要意义。本文在吉林省科技支撑计划重点科技攻关项目—基于SQUID的磁极化-感应双场
近几年篮球运动向着小、快、灵的方向,攻防转换节奏加快,想要适应现在的比赛节奏,需要优秀的身体素质作为前提,尤其是出色的弹跳力,是影响比赛成绩和比赛观赏程度的关键因素,
电化学传感器具有体积小、成本低、响应速度快、灵敏度高、抗干扰能力强等优势,在分析化学中占有重要地位。纳米材料因其比表面积大、催化活性高而被广泛应用于电极修饰材料,
电视纪录片自产生起就因具有广泛的传播范围,长久的留存方法和贴近式的观察等特点,被人们接受和喜爱。影像纪录既加速了文化的传播,又满足了人们探究他者文化和洞察社会百态
反向抵押权是老年人通过自有产权房屋进行担保以获取养老资金的一种权利,我国《民法典》物权编对此未作规定,但国外已有将反向抵押权规定在民法典中的先例。构建反向抵押权,
随着系统级封装技术及制作工艺的不断发展,封装结构的集成密度急剧增加,对集成电路热问题进行数值分析计算量也越来越大。相应地,串行计算变得也越来越困难。与此同时,多核计