基于哈希加速的近似最近邻检索算法研究

被引量 : 0次 | 上传用户:woshichuanqi007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时间的推移,最近邻检索算法在大数据处理相关问题上的重要性日益凸现。传统的暴力检索的方法是线性的,在处理大规模高维数据时过于低效。学者们提出的许多传统解决最近邻检索问题的方法,分别是从构建高效的数据结构(如层次聚类树结构和图结构)和使用哈希技术加速数据点间的距离计算这两个方面出发的。在本文中,我们提出了一个新颖的统一近似最近邻检索框架,将数据结构的高效剪枝能力与哈希的数据点距离快速计算进行融合,大幅提升了近似最近邻检索算法的性能。本文提出的基于哈希加速的近似最近邻检索框架,先使用哈希方法对数据点进行编码,然后采用两步排序策略,在原近似最近邻算法的数据结构上进行检索加速。我们进一步拓展与落实上述思路,提出了将哈希分别与层次聚类树结构、一般图结构融合的近似最近邻检索方法。同时,为了规避传统图最近邻检索算法中存在的局部最优问题,我们还提出一种使用松弛检索停止条件的图最近邻检索算法,使得算法拥有更长的检索扩展路径。在诸多大规模高维数据集上的实验结果表明,本文提出的近似最近邻检索框架相比于其他前沿的近似最近邻检索技术有明显的优势。
其他文献
目的研究酸枣仁功效成分的含量对小鼠睡眠的改善作用及改善睡眠的初步机理。方法用化学方法测定酸枣仁粗多糖、总黄酮和总皂苷的含量,高效液相色谱法测定酸枣仁皂苷A的含量。
目的探讨骨科术后并发下肢深静脉血栓形成原因及预防护理干预措施。方法总结性回顾分析我科自2005年6月至2009年10月收治骨科术后并发深静脉血栓22例患者的临床资料。结果本
目的三线性插值是医学图像体绘制中的基本运算单元 ,每次采样后都需要进行 ,因此高效快速的采样计算是提高体绘制成像速度的重要途径之一 ,特别是在微型机上实现医学图像的体
<正>平面向量与三角恒等变换的结合是高考的热点.现探讨平面向量背景下三角恒等变换的两种常见形式.一、平面向量与三角函数结合例1已知向量a=(cosα,sinα),b=(cosβ,
目的观察独一味对实验性胃溃疡的影响。方法采用吲哚美辛、幽门结扎法制作小鼠和大鼠急性胃溃疡模型,观察并比较独一味与雷尼替丁抗胃溃疡的效果。结果独一味提取物(0.4~0.8
目的 :调查ICU医护人员对机械通气患者早期活动认知、态度及临床实践现况。方法 :采用一般资料问卷和医护人员对机械通气患者早期活动认知、态度及临床实践现况问卷对424名医
近年来,国有商业银行的不良贷款数额和不良贷款率呈逐年上升趋势,不良资产持续增加。不良贷款的形成原因,既有银行内部的经营管理问题,也有外部经济社会环境问题。为预防新增
<正>广东梅州以山地丘陵居多,土壤、水质、空气无污染,拥有众多的山塘、水库,很适宜发展无公害水产养殖。长期以来,梅州水产养殖以四大家鱼尤其是草鱼为主,一些养殖品种的养
“起承转台”,是音乐作品中常用的一种逻辑化结构形式。罗忠镕于2005年秋天完成的新室内乐作品《送别》,其形式简朴而曲风高雅,手法凝练而内涵深刻。全曲的结构与诗歌的起承转合
静生生物调查所是我国最大的民办生物学研究机构,1928年10月1日由动物学家秉志和植物学家胡先骕等人在北平创办。该所为推动我国现代早期的生物学研究、培养人才、普及生物学