语义鉴别和相似性保持的哈希方法研究与应用

来源 :南京理工大学 | 被引量 : 1次 | 上传用户:wgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,二值编码快速的处理速度和低廉的存储空间,使得哈希方法的探索与改进获得了研究者们的广泛关注。二值编码法常应用于图像检索领域,它的主要目的是通过汉明距离为输入图像返回数据库中最近似的图像。哈希作为最常见的二值编码法,可简单地将它分为随机型哈希和学习型哈希两个类别。随机型哈希通过随机生成映射向量来获得哈希函数,生成的哈希函数能够大概率地让近邻样本得到近似的二值编码。尽管随机型哈希得到了统计学理论的支持,但是在实际应用当中需要高维度的二值编码才能获得可观的检索精度。相对而言,学习型哈希的主要能力是让二值编码提炼样本中的相似性信息、分布信息、语义信息等,从而获得更好的性能。在视觉目标跟踪的应用中,外观模型的主要任务是为跟踪算法提供选取候选样本的方式。模板匹配是一种常用的置信计算方式,然而模板与候选样本之间相似度计算耗时巨大,令跟踪方法很难取得快速的处理速度。利用二值编码表示图像物体可以显著降低相似度计算的时间。有鉴于此,在文章中作者提出了能够应用于目标跟踪算法的多特征语义鉴别哈希算法。算法融合了多个具有鉴别力的特征来生成哈希函数,并通过函数将样本和模板都映射为二值编码,接着利用汉明距离来计算候选样本的置信。除此之外,为了使哈希模型适应场景变换和提高更新速率,算法还利用增量学习的方法来实时更新哈希函数。对比实验揭示:在不同场景下,多特征鉴别哈希跟踪法能够鲁棒地对视觉目标实施跟踪。在最近邻图像检索领域,大多数学习型哈希通过学习样本间的相似性,例如邻域结构,来获得哈希函数,并获得了非常可观的检索精度。然而,度量样本间的相似性依然使得模型很难区分近似类别的样本。为了解决这一问题,文章中提出了旨在降低语义信息损失的类别关系度量。基于传统的样本间相似性度量和提出的类别关系度量,文中设计了语义编码与相似性保持映射框架,其主要思想是构建一个统一的映射空间来同时度量样本相似性和语义信息。此模型包含两个重要组件:(1)相似性保持;(2)语义编码。基于这两个组件,将样本特征和语义编码映射到统一的空间中,优化得到的低维映射可以很好保持样本的相似性信息和语义信息。利用提出的映射框架,作者通过将映射空间逼近于汉明空间的方式进一步提出了一个有效的哈希方法。充足的实验证明了所提出的哈希方法能够取得良好的检索精度,对比近几年所提出的哈希方法有明显的性能优势。最近邻图像检索仅能完成单一语义的图像检索任务。实际情况下图像经常含有多层次的语义信息,而传统的哈希方法并没有很好利用这样的层次语义信息。举例来说,boxer狗图像有两个层次的标签“boxer”和“dog”。鉴于这种现象,文章中提出了一种由精到粗相关性图像检索法,其主要目标是:首先返回与输入样本最近似的样本;接着返回弱相关的样本。为了度量算法在由精到粗相关性图像检索上的性能,设计了一种能同时度量各个语义层次检索精度的新指标,即FC(Fine to Coarse)度量。考虑到目前的哈希方法并不能有效处理语义层次相关性的图像检索问题,作者提出了一个简单有效的语义编码哈希方法。语义编码哈希通过生成和调整输出编码达到植入层次语义信息的目的。多样化的实验表明了由精到粗相关性图像检索的实用性,以及所提出的哈希方法能够很好地完成按语义相关性顺序检索的任务。随着互联网数据量的不断增长,图像数据也呈现大规模增长的趋势。数据的不断涌入会使得数据分布产生变化,因而初始训练的哈希函数会逐渐缺乏鉴别力。近年来在线更新的哈希模型被提出,一定程度解决了哈希在线学习的问题。然而随着数据规模的不断加大,样本二值编码的更新将变得非常耗时。为了降低这部分耗时,文中提出了一个加快更新速度的方法,称之为局部哈希更新。局部哈希更新法的基本思想:选择部分哈希函数进行更新,从而减少了哈希函数以及对应编码的更新数量,达到节约处理时间的目的。作者提出了一个贪婪式的哈希函数选取框架,并利用相似性保持的损失函数来选取部分哈希函数。实验揭示局部哈希更新法两大特性:(1)该方法能够有效地提高更新速度;(2)该方法能够最大程度地保持原有函数的鉴别力。最后,本文总结了所提出的哈希方法的特点及其应用场景,同时讨论了方法的优劣并给出了未来可能的拓展工作。
其他文献
采用精密分馏柱对稳定凝析油进行实沸点蒸馏。所测试的数据可以正确描述油藏流体中液相(稳定凝析油)组成的分布,给出C4-C15^+各级馏分的重量百分比、体积百分比、摩尔百分比、分
目的探讨冰冻血浆(FP)与红细胞(RBC)中等比例输血对创伤后失血性休克患者预后凝血功能及生存周期的影响。方法选择创伤后失血性休克患者14例,根据随机数字表法在不同FP与RBC输注
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的 探讨血栓弹力图对严重创伤患者凝血功能的影响。方法 严重创伤患者60例,取静脉血分别在不同时间点和不同温度下测定TEG,分析凝血反应时间、凝血形成时间、凝血形成速率
设D、E、F分别是△ABC的三边BC、CA、AB边上的点,若△DEF∽△ABC,则称△DEF为△ABC的内接相似三角形.文[1]给出了任意三角形与其内接三角形相似的一个充要条件,读后颇受启发,
城市的可持续发展是当今城市发展的重要理念,以重庆国际马拉松赛为案例,探讨了节事活动如何推动城市的自然生态环境和人文生态环境的长足发展。研究发现,节事活动作为城市中
目的研究玉竹提取物玉竹多糖(EA-PAOA)对链脲佐菌素(STZ)诱导的1型糖尿病小鼠血糖、血脂、胰岛素及其外周细胞因子的作用影响。方法采用STZ小剂量多次注射1型糖尿病小鼠模型,
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
在小学教学阶段,数学是一门重点课程。数学阅读是一种创新的教学模式,也是锻炼学生知识运用能力和数学思维品质的主要途径。因此,教师应该延展教学思路,重视小学数学阅读,讲数学问
涠11-4油田位于南海北部湾盆地涠西南凹陷,距广西北海市1O3km,离涠10-3油田17km。油田于1993年9月19日投产,目前开发形势较好,产量、压力稳定。在开发实践中我们体会到,要提高油田开