无结构P2P网络中基于索引机制的稀缺文件搜索算法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:erapple
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于P2P结构上的独特优势,P2P系统近年来得到了快速的发展,以Gnutella,和KaZaA为代表的文件共享系统已成为Internet上增长最迅速的应用。在无结构化P2P文件共享系统中,当用户对流行文件进行查询时,系统能够以较短的响应时间搜索到大量的结果,但对数量较少的非流行文件(稀缺文件)的查询,系统在经过较长的响应时间后仍难以搜索到足够的结果来满足用户需求,查询失败的可能性很高。由于对稀缺文件的查询占系统总查询量的3%~15%左右,因此如何在无结构P2P中提高稀缺文件搜索的成功率已成为迫切需要解决的问题。为此,本文针对稀缺文件提出了一种基于信息量的索引方案和搜索算法IBFS(Index-and-information-based BFS)。 IBFS在PFIS索引方案的基础上加以改进,在信息量指导下将稀缺文件的索引动态发布到流行节点上,并使搜索算法尽可能向流行节点路由查询消息,从而通过索引机制提高稀缺文件的查询成功率。IBFS算法主要有三方面的特点。第一,区别对待流行文件和稀缺文件,针对二者使用不同的搜索策略,使搜索算法对各种不同流行度文件的查询更有针对性。第二,搜索算法的动态终止机制,能够克服传统P2P搜索机制中缺乏动态控制的弱点,解决了流行文件命中数目过多和稀缺文件查询数量不足两个问题。第三,索引方案按信息量平衡原则进行索引发布,消除了网络中大量存在的Free-rider节点对搜索效率的严重影响。 仿真实验结果表明IBFS方法大大降低了稀缺文件的搜索范围和查询消息数量,与Gnutella基本洪泛算法相比,针对稀缺文件的查询在成功率相同情况下网络流量减少了1个数量级,比使用随机索引方案的PFIS算法节省大约50%的网络带宽,而仅以增加少量的延迟为代价,提高了稀缺文件的搜索效率。对于给定结果需求数量的查询,其动态终止机制可返回适量但足够的搜索结果,IBFS方法的满意度与Gnutella洪泛和PFIS相比分别提高了3.5%和5%,从而帮助用户获得可用性更强的P2P文件共享系统。
其他文献
随着计算机系统和网络的广泛应用,可用性和高性能成为计算机系统所追求的目标,集群技术的出现和发展很好的解决了这两个问题。集群就是由一些互相连接在一起的计算机构成的一
基因表达数据是通过DNA微阵列技术获得的关于一组基因表达过程及其调控信息的定量描述。研究基因表达数据,获取有意义的基因簇,对于研究生物现象背后的本质、遗传性疾病的诊
在如今信息过载的互联网世界中,推荐系统扮演着越来越重要的角色。根据各种网络服务平台上数字产品的特征不同,对推荐系统功能、性能上的需求也会有较差异,数字音乐产业也不
企业信息系统在适应变幻莫测的市场需求时必须能够有效的集成已有软硬件及数据资源,由于原有信息集成技术的能力不足逐步显现,使得基于ESB的企业信息集成方法与技术已成为当
Ad hoc网络是一种无中心自组织的无线网络,其不依赖基础设施,因此在军用、民用等很多领域都有广泛的应用。因为Ad hoc网络主要由一些移动便携设备组成,这些设备通常只有有限
人类社会已经步入了一个信息量高速增长的信息化时代。搜索引擎技术使得人们能够更方便的寻找信息。但是,信息的持续增长让传统的搜索引擎也显得难于处理,为了解决海量Web信
随着XML数据的日益增多,XML已经成为了互联网上数据表示和数据交换的标准格式。同时也涌现出大量的XML数据存储方法,比较有代表性的有XML专用数据库存储、面向对象数据库存储
数据挖掘就是从巨量数据信息中获取有意义的知识的过程,目前已经成为一个研究的热点。分类规则挖掘是数据挖掘的一个重要研究领域。在分类规则挖掘中,人们通过对历史或已知数
随着嵌入式设备广泛运用,数字液晶显示电子推拉力计也在市场出现并在教学试验,工业生产领域的精确计量得到大量的应用。基于电子推拉力计的发展现状,通过比较各种产品的优缺
随着数据库与信息技术的深入和发展,时态信息处理已成为许多新一代数据库与信息系统的关键技术。时态数据库将时间作为数据的属性纳入系统的管理范畴,存储和管理多个时间状态的