【摘 要】
:
随着移动设备,互联网以及存储技术的飞速发展,数字图片变得越来越容易获取,每天都有数以亿计的图片被上传到社交平台上,如何在海量的数据中快速准确地找到用户所需要的图片,成为图像检索亟待解决的问题。通常图像检索有两种查询方式:基于文本的查询和基于内容的查询。基于文本的查询根据用户输入的关键字与标签进行相似性匹配,基于内容的查询需要用户输入一幅图片,根据图片的视觉相似性进行查找。目前主流的一种查询方式是文
论文部分内容阅读
随着移动设备,互联网以及存储技术的飞速发展,数字图片变得越来越容易获取,每天都有数以亿计的图片被上传到社交平台上,如何在海量的数据中快速准确地找到用户所需要的图片,成为图像检索亟待解决的问题。通常图像检索有两种查询方式:基于文本的查询和基于内容的查询。基于文本的查询根据用户输入的关键字与标签进行相似性匹配,基于内容的查询需要用户输入一幅图片,根据图片的视觉相似性进行查找。目前主流的一种查询方式是文本内容混合检索方式,即先通过文本查询获得初排结果,继而根据图片的视觉特征对初排结果进行再排序,工业界常称之为图像重排序。目前图像重排序存在着两个问题:首先初排结果作为重排序的一种监督信号,它的质量的好坏也同样影响重排序之后的效果,然而由于目前图像数据集中的文本质量不高,许多文本中含有大量的噪声,这就导致了初排质量的下降;其次,现有的关于多特征融合的检索方法未考虑到多模态特征的自适应调整,并且当特征种类增多时未考虑稀疏化的问题。针对以上存在的问题,本文提出了一种多模态图像重排序的算法,主要工作罗列如下:(1)标签增强。针对图像数据集中文本数据噪声较多的问题,本文使用标签增强技术进行解决,包括标签去噪和补充标签。使用近邻投票方法对标签进行去噪,其主要依据为:视觉内容相似的图片,它们的标签数据集大多都有重叠。标签去噪后有些图片中可能含有空的标签集,这样会导致许多丰富的信息丢失,解决方法是使用替代法,根据近邻图片的标签来为该图片补充标签。通过实验对比验证了标签增强后对初排结果的有效性。(2)多模态特征自适应融合。将多种模态的视觉特征集成于统一的框架中,为每种模态分配一个权重,通过对模型的求解来进行权重的自适应调整。模型添加了一个权重约束正则项,表示方式有两种:L1范数和L2范数。添加L2范数进行模型求解时采用支持向量机中SMO算法的思想;另外,当模型使用的特征较多时,并不能保证每种特征都有效,需要进行特征选择,于是本文还提出了将多模态与稀疏学习相结合的方法,使用L1范数来进行稀疏化。通过大量的对比实验,结果表明L1范数相比其他方法能够达到特征选择的目的。
其他文献
传统汽车由发动机、底盘、车身、电器等构成,而新能源汽车将发动机部分改为电机,利用控制器(ECU)控制电器。新能源汽车一般情况下是把电能转换为机械能,然后驱动汽车。本文介
泡沫保温材料属于无机多孔绿色节能建材,作为建筑外墙的保温层,不仅能起到较好的保温作用,而且原料来源广、价格低廉、绿色环保。虽然泡沫保温材料作为建筑外墙保温材料具有很多优点,但在生产中需掺加大量水泥,带来经济和环境压力。本论文针对目前泡沫保温材料固废掺量较低的问题,以铁尾矿、粉煤灰等固废为原料,硅酸盐水泥为胶凝材料,采用物理发泡的方法,通过添加膨胀聚苯乙烯(EPS)颗粒和SiO2气凝胶填料制备了具有
执行程序和审判程序都是民事诉讼程序的重要组成部分,两个程序之间相互衔接、相辅相成,两个程序作用的有效发挥使得当事人之间的纠纷得以解决、权利得以实现。生效法律文书确定了双方当事人的权利义务,而执行的完成与否则决定了执行依据所确定的权利义务能否实现。当事人处分权的行使贯穿了审判程序和执行程序的始终,对当事人处分权的尊重在民事执行和解中得到了充分体现,民事执行和解作为民事执行程序中的一项重要制度,扮演着
多径效应导致雷达回波信噪比衰减,通过分离、抑制多径信号,可以改善多径信号造成的性能下降问题。考虑多径信号中同样包含了目标的部分信息,若能提取并合理利用多径信息,则可以进一步提高雷达性能。时间反演(Time Reversal,TR)通过利用多径信号实现了能量的自适应空时聚焦,提高了回波信噪比,这一特性为解决多径环境下的目标检测问题提供一种新方法。论文围绕多径环境的目标检测及参数估计展开研究,建立了多
目的:本研究采用流式细胞仪检测外周血淋巴细胞中γ-H2AX的表达水平,建立一种快速、高通量检测淋巴细胞γ-H2AX含量的方法,并研究电离辐射对淋巴细胞γ-H2AX含量的影响,建立相应
介绍了数字经济研究的起源,并分别对数字经济在国内的研究现状和内蒙古自治区关于数字经济的研究现状作了综述,供相关学者进行相关研究时参考。
近年来,由于互联网上诸如文档、图片、音频、视频等多模态数据的规模的急剧增长,跨模态检索这一课题吸引了越来越多的研究人员的注意。通常,不同模态的数据用于描述共同的事件或者主题。跨模态检索定义为:输入一种模态的数据作为查询,查询得到相关的另一种模态的数据。举例来说,用户输入一段新闻报道作为查询的输入,检索得到相关的图片或者视频。跨模态检索的应用范围十分宽广,包括:热点探测,个性化的推荐,搜索引擎等等。
目的:通过采用电针夹脊穴疗法配合灸法加口服西药的方法,观察带状疱疹后遗神经痛患者的疼痛时效及生活质量。方法:将符合纳入标准的60例带状疱疹后遗神经痛患者按照计算机随
目的 :探讨中性粒细胞/淋巴细胞比值(neutrophil-to-lymphocyte ratio,NLR)与早期原发性肝细胞癌(hepatocellular carcinoma,HCC)临床病理特征及预后的相关性。方法 :收集113
近十年来随着太赫兹源和太赫兹探测器的相继问世,太赫兹技术得到迅速发展。太赫兹成像技术在材料的特性分析、机场安检、生物组织诊断、雷达成像等领域具有重大的实用价值。