论文部分内容阅读
随着互联网的迅速发展,传统的客户机/服务器模式越来越难以应付全球范围内数百万计的用户请求,出现了服务瓶颈,而计算机硬件性能的飞速增长,使得客户端执行更复杂的任务成为可能。此外,接入互联网中的设备的数量和种类也越来越多,这些设备上存储了大量可用的资源。在这种背景下,对等网络应运而生,互联网的共享模式也逐步从客户机/服务器模式演变为对等网络模式。按照对等网络的拓扑结构,可以将其粗略分为两大类:结构化对等网络和非结构化对等网络。无论是哪种类型的对等网络,其面临的一个核心问题就是如何找到存储有用户所需资源的节点。因此,目标资源的查询路由算法研究是对等网络的关键部分,该算法的效率和代价直接决定了对等网络的性能。另一方面,节点上存储内容的不断变化、节点频繁地加入和离开网络以及节点和/或链接故障的发生都会降低对等网络的查询命中率。依赖备选路径的静态网络重构方法对动态环境适应度较差,而基于单纯的交换消息来建立动态重构网络的方法产生的消息数量又过于庞大。因此,有必要研究动态环境下对等网络的自适应重构机制。本文研究了对等网络中的查询路由与重构机制,主要贡献有以下四个方面:1.提出了一种层次结构化对等网络SkipCluster,可以有效地支持精确匹配查询和多维范围查询。SkipCluster;采用两层体系结构:高层(Higher Tier)结构和低层(Lower Tier)结构。其中,高层结构由代表不同簇的超级节点组成,而低层结构由簇内节点组成。设计了一种被称为三链表(Triple Linked List,简称TLL)的数据结构来存储超级节点在高层结构中的指针。三链表可以通过在簇间路由过程中发现最长前缀匹配来加快路由。在低层,SkipCluster将簇内节点按照指数增长速度往前后两个方向分别划分为长度不等的若干段。其中,第h段的指针可以跨越2h个节点,条件是当且仅当每一段中不是所有的节点都离开网络。实验结果显示,SkipCluster可以在不消耗额外存储空间的前提下加快不同大小网络的精确匹配查询和范围查询的效率;2.提出了一种路径可追踪查询路由(Path-traceable Query Routing,简称PQR)机制。路径可追踪查询路由建立在一种叫做可追踪增益矩阵(Traceable Gain Matrix,简称TGM)的数据结构上。可追踪增益矩阵用来记录查询命中路径上各个节点的增益(Gain)以便优化查询路由。当查询请求在某个目标节点命中后,增益将会沿着查询命中路径中从目标节点到源节点的方向,在相邻节点之间按照当前节点到目标节点之间路径长度的指数衰减速度传递。当一个节点接收到一个新的查询请求时,该节点将会计算相同查询消息曾经转发并命中的邻居节点的增益值。增益值最大的查询对象所在的邻居节点将以最大的概率被选为转发该查询消息的候选节点。实验结果显示,路径可追踪查询路由算法可以在较低带宽消耗的条件下达到较高的查询命中率;3.提出了一种基于移动Agent的重构机制来实现对等网络节点和链接故障的诊断与恢复。定义了三种类型的故障:单链接故障、多链接故障和节点故障,并针对这三种类型的故障提出了一种两阶段故障诊断(Two-Stage Failure Diagnosis,简称TSFD)机制和三种故障恢复算法来提高对等网络在发生故障情况下的可用性。实验结果显示,与同类算法相比,TSFD可以在较低的存储代价和网络代价前提下,取得更好的恢复效果;4.实现了一个基于P2P的课件搜索与共享系统LESSON (LEcture notes Searching and Sharing Over InterNet)。LESSON使用元搜索引擎进行课件搜索以及P2P覆盖网络进行课件共享。为了提高共享过程中课件搜索的效率,LESSON;采用了本文提出的路径可追踪查询路由机制。为了解决元搜索引擎中的结果合并问题,针对搜索对象的特点,提出了一种启发式结果合并算法:排名、相似度与特征(Rank, Similarity and Features,简称RSF)算法。实验结果显示,RSF结果合并算法的平均有效性不仅比单个成员搜索引擎要高,也比没有考虑课件特点的其它结果合并算法的有效性要高。