论文部分内容阅读
客户/服务器计算模型(Client/Server:C/S)是现代互联网的核心。结构的简练和高效使其成为Internet的主流,现有应用也多以此为基础。但在高速的下一代Internet平台上,该模型面临诸多问题与挑战。其中,服务瓶颈问题尤为突出。分布式计算是有望解决服务瓶颈问题的候选技术之一。在过去的几年里,Napster和Gnutella这样的文件共享软件在Internet上迅速传播,用户数量急剧增长。在这样的系统中,数据被保存在用户的计算机中(我们称之为对等结点,Peer),而不像以往的客户/服务器模式那样把数据存放在集中的服务器上。这种运行于多个对等结点(Peer)之上的网络被称为对等网络(P2P)。今天,P2P应用的带宽已经超过万维网,成为占用互联网带宽最多的部分。在对等网络中,数据在对等结点之间直接传递。随着对等网络规模的增长,数据的存储和搜索成为迫切需要解决的问题,也成为了研究的热点。从2001年开始,有关P2P的研究主要集中在结构化覆盖网及分布式哈希表(Distributed Hash Table,DHT)的理论研究。目前,单纯的理论研究热潮正渐渐转向如何将这些P2P理论结合起来并应用于实际系统当中。其目标是体现出P2P系统在可扩展性和容错能力等方面的优势。目前,许多实际运用的P2P搜索机制都提供与本地存储无关的路由基础结构。其中几种基于分布式哈希表的P2P机制已有较为广泛的应用。它们在具有许多优点的同时,依然存在几个重大问题,影响了实际使用效果。首先,P2P查找经常受到覆盖扩张(overlay dilation)的影响。覆盖扩张是指与底层网络最佳路由相关的,无必要的路径长度的增加。忽略交换时间,这种反应时间上的延迟与路径长度的增加大致成比例。第二个与DHT相关的问题是,由于文件经哈希函数处理后被随机分散到不同位置,文件的所有者对文件的控制能力实际上是很弱的。文件的发布者或所有者不能决定哪些节点存储哪些文件。DHT的另外一个问题是它难于处理复制(replica)问题。尽管现在提出了几种处理复制问题的方法,但都有其不足点。这种情况下,发布者实际上缺乏对文件的控制能力。在P2P的发展过程中,文件共享系统始终是P2P研究的动力之源。这也促使我们尽量发掘更适合文件共享的数据结构。Bloom filter对数据集合采用一个位串表示并能有效支持集合元素的哈希查找操作。早期用于数据库,现在则更多的用于网络应用中。在路由和资源发现方面,基于Bloom filter的方法可以显著地减少查找临近文件的覆盖延迟,但对较远的文件影响较小。本文描述了Bloom filter用于路由的基本思想;并提出了引入距离概念的改进距离加权Bloom filter路由算法。该算法可以较为显著地改善普通Bloom filter路由中路由失败率较高、对不同网络拓扑结构适应性差的问题。本文以分布式计算为理论基础,以对等计算环境中的分布式路由算法为主攻对象,开展了基于距离加权Bloom filter的分布式路由算法的研究,内容主要涉及基于距离加权Bloom filter的分布式路由算法、该算法的数学分析,以及实验模型和测试手段等。研究工作取得了以下进展:●把距离的概念整合进Bloom filter中,让Bloom filter中的比特位表示距离以产生距离向量。一个距离加权Bloom filter(distance-weighted Bloom Filter,dwBF)是一串整数而不是标准Bloom filter里的一串比特位。采用距离加权Bloom filter路由方式。可以在发生误称时形成一个路由更正机制,大大降低路由失败率。●通过设置dwBF,解决了普通Bloom filter只能用于树型拓扑网络的问题。使得具有良好数据性能的Bloom filter能够直接应用于各种实际网络而不是仅能依靠覆盖网技术来进行路由。●增强了文件发布者对文件的控制能力。在P2P网络中,由于文件经哈希函数处理后被随机分散到不同位置,文件的所有者难以对文件的使用和传播进行控制。文件的发布者或所有者不能决定哪些节点存储哪些文件。我们通过在数据结构里增加一些附加位,用以控制访问权限。这样,可以加强发布者对资源的控制。在处理侵权等方面非常有效。●解决了现有P2P系统难于处理复制(replica)的问题。目前,虽然有学者通过在指针节点增加多个指向复制服务器的指针的形式来解决复制问题,但是这需要一种在多个复制之间进行选择的机制。而且,尤为严重的是,指针节点有可能成为单点错误。通过dwBF算法独立地设置每个复制的dwBF。路由过程能以较高概率选择一个较近的复制。提高了搜索效率。