Hamming空间中的快速近邻检索算法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:LoveYouNeverChange
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近邻检索问题是机器学习与数据挖掘领域中的一个较为基础的研究问题,其相关的实际应用问题数不胜数,例如相似图像检索、基于近邻检索的图像分类问题等。过去的几年中,近邻检索方面的研究层出不穷,近邻检索问题的相关算法大致可以分为五类:线性扫描算法、树形索引算法、近邻图算法、哈希算法以及反向索引算法。线性扫描算法是解决近邻检索问题最基本的方法,即通过遍历每个数据进而找到查询数据的近邻。树形索引算法利用了树形数据结构划分空间,并建立索引结构来进行近邻检索。近邻图算法对数据库中的数据建立近邻图结构用于辅助近邻检索过程。哈希算法通过将数据由原始数据空间映射到Hamming空间,进而将近邻检索问题转化为Hamming编码相关的问题。反向索引算法通过聚类等方法建立反向索引结构用于提高近邻检索的效率。相关的近似近邻检索算法被提出[1],该方法提出了“桥向量”的概念,其概念和乘积量化[2]中聚类中心的概念比较类似。该算法基于桥向量和增强近邻图,提出了“需求驱动的实时提取”策略,在线检索阶段采用优先级搜索的方式进行近邻检索。近些年来,基于二进制编码和二进制视觉特征的大规模图像检索方面的研究在计算机视觉领域引起了广泛的关注。尽管二进制编码以及二进制特征可以提高计算效率,但针对大规模数据库通过线性扫描来检索近邻的方法依然计算开销巨大。在这篇文章中,我们将[1]中的近邻检索算法进行泛化,将其适用性扩展到Hamming空间。该扩展算法利用了Hamming空间中的K-平均聚类算法。我们提出的方法和现有的Hamming空间中的近邻检索算法(如多索引哈希算法[3]和FLANN算法[4])相比有较好的结果,在检索准确性、被访问数据数量以及平均检索时间三个方面均超越了现有的方法。
其他文献
改革开放后,我国的城市化进程发展迅速。快速的城市化进程往往注重硬指标,要想满足社会日益增长的文化需求,增强城市竞争力,实现全面小康的目标,必须加强城市文化建设。档案资源作为城市文化发展的记录者,其文化功能正日益突显,因此,将档案信息服务融入城市文化建设是大势所趋,必要之事。各城市在档案工作中应积极促进档案信息服务融入城市文化建设,使两者协同发展。本文理论联系实际,通过探析石家庄市档案工作中档案信息
在计算机视觉领域中,行为识别方向是其中一个非常重要的研究分支,随着计算机软硬件性能的不断提升,使得现在卷积神经网络的深度和复杂度与之前的网络相比有了大幅度的提升。
勃起功能障碍(erectile dysfunction,ED),又称阳痿,是一种典型的男性性功能障碍疾病,主要以阴茎勃起的启动和维持困难为主要表现,国外有研究表明,52%的40-70岁男性存在不同程度的ED,年发病率为25.9/1000。我国研究也显示40岁以上男性勃起功能障碍患病率达40.2%,并且近年来呈高发及低龄化趋势,这可能与人们逐渐重视生活质量的意识水平提高有关,但同时,随着近年来生活水
全身性动脉硬化会导致血液循环停滞,甚至引发梗死。视网膜动脉硬化是全身性动脉硬化的典型表现,且视网膜血管是唯一可进行无创观察的血管,因此可通过定期视网膜动脉硬化检测
在混合现实远程临床治疗或手术过程中,远程指导端在病患器官三维重建的虚拟模型上对手术部位进行标注完成对本地端的手术指导。本地端医生通过头戴式透镜将重建的器官模型和
近年来,随着国内多地频繁出现“城市看海”以及洪涝灾害现象,给城市系统造成巨大压力和破坏的同时,也给城市居民带来一定的经济损失并威胁生命安全。为有效应对城市内涝的态
相比于传统的电子式传感器而言,光纤传感器具有精度高、体积小、耐腐蚀以及抗电磁和辐射干扰等诸多优点。在光纤传感技术的基础上所发展起来的光纤表面等离子体共振(Surface
建设智慧钢铁工厂是钢铁企业响应“中国制造2025”的重要方向,热轧作为钢铁生产全流程炼钢-连铸-热轧中最后一道工序,其产线设备的健康状态是影响企业可持续生产的重要因素,
乳腺癌具有较高的发病率和死亡率,严重威胁女性的身体健康。因其发病机理难以确定且病情隐匿,所以早期乳腺癌很难被发现,不易引起患者的重视。大量乳腺癌患者由于错过最佳治
即时定位与地图构建技术自上世纪八十年代发展至今,已通过不同传感器解决了诸多限制性场景内的定位和建图问题。当下,由于对机器人在更多非限制性场景中完成工作任务的迫切需