基于改进LLE的哈希图像检索算法研究

来源 :东北师范大学 | 被引量 : 1次 | 上传用户:lwh849453
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的到来,图像、视频、音频等数据呈指数趋势不断地增长。“维度灾难”让传统的图像检索技术中的检索效果和检索速度逐渐发生退化。在图像检索的研究中,特征提取和索引构建都是检索任务中的关键技术。为了降低图像维数,很多研究者将注意力转移到流形学习上。其旨在高维空间中找到低维流形结构进行嵌入映射,以此达到降维效果。哈希方法通过将原始图像转化为紧凑的二进制码表示,减少了数据存储所占用的空间,还可以加快检索速度。因此,流形学习与哈希函数相结合能够更好的适用于大规模图像库检索。基于哈希的图像检索算法大致上可分为两个阶段,先降维然后再量化。这两个阶段对于最终图像检索性能的影响都是至关重要的。为了减少间接优化带来的损失,研究者已考虑到直接在汉明空间中通过学习最优二进制编码来保留原始数据之间的相似性。如何更好的体现原始数据间的相似性,对学习到最佳二进制编码也是同样重要的。本文的主要工作如下:提出了基于稀疏性LLE的哈希算法(SLLH)。该算法对流形学习中经典算法LLE进行改进,采用一种稀疏的权重表示,使每个数据点找到更适宜自己的最近邻居以达到更好地保存原始数据间的流形结构的目的,其次尝试在汉明空间中直接学习和保留流形结构。即由原始特征空间中相似的数据点重构二进制码,这样不仅完好地保留的原始数据间的相似性同时还减少了间接优化带来的误差。提出了基于锚点的LLE的哈希算法(ASLLH)。基于LLE的哈希算法,这也是以往在基于流形的哈希方法中普遍存在的问题。在运算过程中都忽略了在哈希函数学习过程中需要计算原始数据的相似度矩阵,这将导致哈希函数的离线学习非常耗时且耗费内存。为了进一步处理时间和内存消耗问题,采用锚点集替代整个数据集进行计算,即通过利用K-means聚类产生锚点的非对称图来近似LLE算法中的原始相似度的矩阵,减少运行时间和内存。通过在多个常用的公开的大规模图像数据集进行测试,本文所提出的算法与目前主流的图像哈希算法相比较都表现了良好的检索性能。在基于前面算法研究上,成功开发了一套使用简单且有效的图像检索系统,并借助于相应的实验对提出的检索算法加以验证。
其他文献
铝合金无缝气瓶内表面缺陷的检测是提高企业竞争力、改进生产工艺的关键环节之一。以往的气瓶缺陷检测方法主要是工人使用内窥镜进行多角度观察,不仅准确率低,还难以满足生产
含磷有机化合物在生物医药、农业、新型阻燃材料、有机合成及不对称催化等领域有着广泛的应用。其中,炔基膦化合物(含有spC-P键)因其具有独特的碳碳三键,通过一定反应条件可
水源水库作为地表水的主要存在形式,已成为重要的饮用水水源。水污染中以水体富营养化最为严重,其中氮素是导致水体富营养化的最关键因素之一。本文从李家河水库沉积物中筛选
随着人工智能技术的飞速发展,人机对话系统有望代替目前主流的输入设备,成为人们最常用的人机交互方式。对话生成是对话系统中最重要的环节之一,它是指计算机基于一定的对话
国际上与科学态度有关的研究始于上世纪60年代,而在我国,该领域的相关研究起步较晚,直到2001年新一轮的基础课程改革中提出情感态度价值观的教育目标后,科学态度这一名词才引
信息科技的飞速发展使得全球数据量爆炸增长,在海量数据中快速、有效地检索到目标数据的top-k查询方法是当前计算机研究的热点问题。在海量数据中,使用传统的top-k查询方法返
如今,5G通信技术已经在2020年步入商用,除了人们对可靠通信有着越来越高的要求外,移动通信也面临着更多越来越复杂的应用场景,通信终端为了满足物联网的需求也更加多样化。第
传统有雾图像中不仅含有雾气,更含有严重的噪声。这些噪声有些是因为空气中含有的烟、灰尘等小颗粒所造成的,有些则是因为在雾天拍照数字图像在传输过程中所产生的噪声。基于
意大利科学家Benzi等人提出了随机共振的概念,用来解释地球远古气象中出现的冰期与暖气候期周期交替出现的现象。其原理是在非线性系统、信号与噪声达到某种协调关系时,部分
众所周知,焊接工艺参数决定了焊缝几何形状,而后者可以反映前者。研究有效的方法来建立焊接工艺参数和焊缝几何形状之间的关系,对于提高焊接质量和降低焊接成本非常重要。焊