Peer-to-Peer网络信息共享模型的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:robotech
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Peer-to-Peer Systems(对等系统)作为一种新型的大规模分布式系统,正以前所未有的速度迅速发展,深刻地改变了个人计算的方式。而以Gnutella等为代表的P2P信息共享系统,凭借其庞大的用户群、海量交互数据,成为当今Internet最重要的P2P应用之一。该类全分布、非结构化的系统拥有良好的分布性、健壮性、易部署性,和对动态网络的适应性。但系统通常采用基于泛洪的广播搜索机制,引发了大量冗余的网络流量,严重阻碍了系统的可扩展性。 本论文以Gnutella协议作为P2P网络信息共享应用的研究实例,主要针对协议泛洪广播机制性能低下的突出问题,利用Gnutella网络拓扑内在属性,提出了改进的可适应性兴趣搜索算法,并对算法进行了详细的分析推导和性能测试。本论文的具体研究工作可分为以下几方面: ◇ 分析了Gnutella协议框架,主要包括数据结构、路由规则和工作原理。重点分析了Gnutella协议具有代表性的泛洪路由机制。通过泛洪广播的流量测度,量化分析了路由机制的低效性,为后续章节对搜索协议的改进、仿真实验做了良好的铺垫。 ◇ 分析Gnutella网络拓扑内在的小世界(Small World)现象和兴趣簇集。详细分析了小世界现象的2个重要特征指标——簇集系数和特征路径长度,以及小世界现象在Gnutella网络中的存在。在此基础上,分析用户搜索行为引发形成的小世界兴趣簇集,为可适应性兴趣搜索算法的兴趣簇集策略提供了理论基础。 ◇ 分析Gnutella网络拓扑内在的幂律(Power Law)属性。形式化验证了3条主要幂律及其对P2P网络拓扑的含义。该部分内容不仅是上一章工作的延续和补充,也为可适应性兴趣搜索算法的主干节点优先搜索策略给出了理论依据。 ◇ 利用Gnutella拓扑结构内在的小世界和幂律特性,以及用户搜索社区中表现出的兴趣行为,本论文提出可适应性兴趣搜索算法,ASI(Adaptive Search with Interest),试图提高搜索质量,并减少搜索引发的流量代价。该算法包含兴趣簇集策略IBC(Interest-Based Clustering)和主干节点优先搜索策略HFS(I-Iub—First Search)两个组成部分。IBC策略能促进具有小世界特性的兴趣簇集的形成,并将搜索请求有意识转发给较有可能给出响应的那部分节点,同时也有效减少自身发出的无谓请求数。HFS策略利用节点能力的异构性,在簇集拓扑内挑选主干节点,并自组织成高度连通的主干节点簇集(hub cluster)。当查询需要扩散到其他局部簇集时,主干节点利用IBC策略积累的有关其他簇集的兴趣知识,针对性地将查询转发至相关簇集,提高了跨簇集查询的精确度。将以上两部分策略有机结合在一起组成的可适应性兴趣搜索算法,能同时改进搜索性能和搜索代价。基于可适应性兴趣搜索算法,进行了详细的性能测试。在不同网络参数条件下,进行了大量仿真试验,仿真结果表明:ASI算法表现出了良好的搜索性能,有效改进了Gnutella泛洪广播机制。 ◇ 在源代码开放的JTella程序之上,利用其已有的网络功能和接口,对.JTella核心路由机制进行改进,将ASI算法实现为Java类库形式,供上层客户端程序调用。功能测试表明,其达到了最初的设计目标,并能与当前Gnutella协议兼容。 如何有效、可扩展的部署信息共享应用是当前P2P研究领域的主要课题之一。而搜索算法和路由转发机制无疑是其中的核心技术。本论文在着手改进Gnutella协议原有的泛洪广播机制时,充分考虑并利用了Gnutella网络当前的拓扑属性,从而提高了系统整体性能和可扩展性。由于泛洪广播机制在非结构化的P2P信息共享系统中的广泛使用,本论文的研究为该类系统的协议和算法设计做出了一些参考工作,具有一定的理论价值和实际应用意义。
其他文献
报表可从海量的数据中提取有用的信息,清晰直观地呈现给管理人员或操作人员,以协助进行日常管理工作,规范生产活动。报表作为信息提取和显示的重要方式,已经得到广泛的使用。
随着多媒体技术、网络技术的迅速发展,图像信息的应用日益广泛,对规模越来越大的图像数据库中的可视信息进行有效管理成为迫切需要解决的问题,基于内容的图像检索是解决这一问题
软件的规模和复杂度不断增加,使得软件开发面临巨大的挑战.软件复用被视为解决软件危机、提高软件生产率和质量的可行途径.相比较而言,设计模式是高层次的软件复用,也更加切
随着无线通信技术、感知识别技术的发展,越来越多的研究者开始关注于客观世界物品与物品之间信息的通信与交换,物联网的概念也随之被提出。物联网融合了现存的互联网、移动通信
随着网络的不断普及,流数据处理逐渐受到关注,流数据中的聚合计算也越来越重要。在传统数据库管理系统中,聚合函数定义为对一组值进行计算,并返回单个值的函数。在本文的研究中,我
传统基于角色访问控制(Role-Based Access Control,RBAC)系统的授权管理工作主要在于安全管理员为用户分配和撤销角色。当系统的用户数量不断增加时,用户-角色分配和维护的工
随着我国民航事业的发展,空中交通管制的需求越来越复杂,数据量也越来越大。为了适应巨大的数据量需求,目前的空中交通管制系统的系统结构可能会向集群系统结构发展。由于空中交
随着Internet的迅速发展,开发基于Browser/Server的服务器端的程序已经成为Web应用程序开发的重点。虽然现在应用EJB平台开发应用软件可以满足程序开发的需要,但由于在开发期
用户管理一直是网络信息系统的关键,对访问企业信息系统的用户的管理是否有效直接涉及到企业信息的安全性问题,所以对访问用户的管理一直备受企业关注。企业对访问应用系统的
随着Internet的迅猛发展,Web已成为最重要的知识库之一。对这些知识进行高效快速的抽取并加以利用,具有良好的应用前景和应用价值。Web信息抽取的目标是从多个异构的Web站点