图像重排序自适应算法研究与贪心选择方法改进

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lxs000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了研究图像多媒体的搜索问题,图像检索重排序问题在近几年得到了越来越多的重视。重排序是基于初始搜索结果得到的信息而运用算法对初始列表进行排序重构的一种方法,它的目的是让更符合查询关键词信息能够出现在搜索结果栏中比较靠前的位置。为了更好地进行图像重排序,我们将重点着眼于以下两个方面。(1)从图片中提取更有效的特征。(2)构建更好的重排序系统。通过从图片当中提取视觉特征和构建重排序模型,我们充分利用图片的视觉信息来帮助我们进行图片检索重排序工作。通过这些方法,我们可以提高图片检索系统的整体性能。鉴于现有的图像重排序系统之间存在的缺点,我们提出了以下两个方案来提高重排序的性能。下面我们将详细介绍具体的方法。1)利用查询难易度预测对每个查询项进行自适应的重排序。在图片特征方面,我们使用深度卷积神经网络来对图片提取相应的特征。而在模型构建方面,我们使用了Visual Rank算法。为了对不同的查询项进行针对性的自适应操作,我们引入了查询难易度预测的技术。对每个查询项,由于它们内部的图片相关性分布差距是很大的,所以很有必要进行查询项的单独参数调谐。我们利用查询难易度计算,从而对Visual Rank算法中的权重向量和阻尼系数进行单独的设置。2)引入有效的贪心策略对每个查询项进行针对性的图片检索。首先,我们从每个查询项对应的图片当中找到种子图片,这个图片可以代表这个查询项。我们设计了一个简单的打分方法来对原始列表进行筛选,从而能够迅速的选出种子图片。其次,我们可以把对于特定查询项的重排序问题转换成寻找和特定种子图片最相似的图片的问题。使用简单的贪心策略,我们可以高效率的对于每个查询项进行图片的选择。而图片被选入种子图片集合的顺序就是重排序对应的顺序。最后,为了避免只使用一张种子图片所带来的可能误差,我们可以使用多个种子图片,这样对于每个种子图片都可以进行一次贪心选取操作,利用序列融合的思想,我们可以避免使用单个图片作为种子图片带来的实验结果的不严谨。本文主要以图像检索重排序为研究方向,并通过大量的实验结果来验证算法的有效性。对于算法中可以提高的地方,在以后的研究工作中会予以重点的关注。
其他文献
为了确保UMTS(Universal Mobile Telecommunication System)技术的长期竞争力,3GPP于2004年底启动了长期演进(LTE)项目。该系统的一个目标是在上行链路能够提供比R6版本中的HS
在当今信息时代,高质量数码成像设备已得到普遍使用,生活中无处不在的网络又提供了大量的图片资源和视频分享网站,使得数字图像和视频在人们的日常生活中起到日益重要的作用
近些年来,作为声音识别中的一个新兴的研究方向,“声音事件识别”因其广泛的应用前景,越来越受到研究学者们的关注。通过对声音事件,例如敲门声、掌声、脚步声,甚至鸟鸣声等,
随着当今互联网时代下云计算和云存储的飞速发展,网络云端存在的大量图像数据给业界带来了巨大的存储压力。与此同时,这些数据中包含大量的相似图像。它们通常在云端以图像集
扩频通信将信息通过宽带传输,传输带宽比实际传输信息所需的最小带宽要大得多,从而实现抗蓄意干扰和非蓄意干扰、截获率低、保密性好、提高信噪比、安全通信。扩频通信系统是一
随着无线通信和移动计算技术的发展,人们对无线宽带接入提出了更高的要求。然而现今的无线网络采用的通信方式在覆盖范围和网络扩展的灵活性上大多都很有限,无线mesh网络的出现
震动传感器相比于红外、磁敏、热敏等其他类型传感器,具有受外界环境因素影响比较小,探测灵敏度较高等优势,并且震动传感器阵列可以做到智能化识别目标信号。震动传感网防入
基于自动语音识别(Automatic Speech Recognition, ASR)的检索技术是关键词检索(Spoken Term Detection, STD)的主流技术,资源受限情况下(Limited-resource Conditions)的关
期刊
随着集成电路朝着高密度、高速度、高可靠性的方向发展,电路间的数据传输已显得十分重要,由于传统并行接口技术受串扰和时钟同步问题的困扰己不能满足日益增长的高速数据传输要