利用分区和距离实现Chord中高维数据范围检索

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:asdlinux
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着P2P系统的大量出现,P2P技术逐渐成为人们研究的热点。P2P技术目前主要应用在资源共享、分布式计算、协作系统、电子商务和以P2P为基础的深度搜索引擎等方面。其中,信息检索是最常见的一种应用,对现有的图像、视频等高维数据内容的检索更是迫切的需求。 在P2P共享系统中,每个节点既可以将本地资源共享出来与其它节点分享,又可以从其它节点获取资源,实现了服务器与客户端的两位一体。然而,现有的信息检索机制存在着种种不足:基于结构化P2P网络的检索效率很高,但是由于构造过于严格,难以实现模糊、范围、k-近邻等复杂查询,仅支持精确的单关键字查询;非结构化P2P网络实现简单,但是由于搜索的盲目性,其检索效率普遍比较低。 本文在深入研究P2P信息检索技术的基础上,重点研究了基于结构化P2P网络的信息检索技术和高维数据的索引算法。现有的结构化P2P网络对范围检索等复杂查询缺乏有效的支持;单一的使用降维或近似向量对高维数据进行索引查询,索引时会损失高维数据的大量信息,查询时会引入大量的误中点。以Chord网络为基础,针对iDistance索引进行范围查询时引入大量误中点的问题,论文提出了一种基于分区和距离的高维数据索引方法。首先采用Code-Distance索引技术对高维数据建立一维索引值,并利用位置保持哈希函数为每个索引值赋予一个唯一的标识,然后将该标识保存在Chord环节点上,生成BM-Chord系统。在此基础上,给出了数据过滤策略和范围查询算法。最后用实验结果验证了BM-Chord系统在减少查询的误中点个数、提高查准率等方面的有效性。
其他文献
中国象棋的计算机博弈研究起步较晚,但是发展较快。到目前为止出现了许多优秀的中国象棋软件,如许舜钦及其团队的“ELP”、上海计算机博弈研究所黄晨的“象眼”等。但是这些
随着质谱技术的发展,诞生了一门新的学科:蛋白质-基因组学。它是蛋白质组和基因组相交互的研究领域。通过基因组学和转录组学提供的信息,定制新的蛋白质序列数据库,再用这些蛋白
随着计算机软硬件技术、半导体技术、电子技术、通讯技术和网络技术等的飞速发展,各种新型智能化的嵌入式设备日益广泛地走入人们的工作和生活。而嵌入式技术与语音识别技术的
随着数字通讯技术、视频压缩技术以及处理器技术的不断发展,利用便携式设备实现可视电话、视频会议、视频点播等业务成了学术界以及工业界的热点领域。而高效、实用的便携式
随着多媒体通信时代的来临,流媒体技术受到前所未有的关注,并已成为研究热点。在流媒体广泛的应用领域中,能够提供交互式服务的视频点播已经成为最重要的网络多媒体业务之一
当今很多领域都涉及多类模式的识别问题,多类模式的识别具有广泛的应用性,同时也是一个难点。本文意在提出一种比较通用的多类识别算法。视频中的运动物体识别是计算机视觉领
集成了传感器技术、微电机系统技术、无线通信技术和分布式信息处理技术的无线传感器网络是一种全新的计算模式,是继因特网之后将对21世纪人类生活方式产生重大影响的IT热点
轨迹数据在智能交通、城市规划、个人行为模式分析等领域发挥着重要的作用。因此,很多组织都在收集和发布轨迹数据,然而,轨迹数据的直接发布会泄露个人隐私信息。随着因轨迹
纹理的方向性度量是近年来国内外一个比较活跃的研究领域,在模式识别、图像检索、计算机视觉、图像处理及计算机图形学等众多领域中起着非常重要的作用,有着广阔的应用前景。
船舶制造业是我国国民经济的支柱产业,目前我国船舶建造企业面临着由传统的造船模式向现代造船模式过度的发展阶段,生产效率与世界一流的造船企业相比还存在着差距。船舶制造属