论文部分内容阅读
近年来,对等网络日益成为Internet一个重要应用。对等网络将Internet边缘节点的资源收集起来,提供强大的计算与存储能力。无结构对等网络由于查询的灵活性和对动态环境的适应性,得到大力部署,成为对等网络的主流。但无结构对等网络存在网络性能低下等困难,这使搜索算法一直是无结构对等网络的研究重点。本论文研究无结构对等网络的内容搜索算法和分布式索引缓存算法,主要研究内容和创新成果如下:1)提出了一个基于查询代理的自适应无结构对等网络盲搜索算法(QAA, Query AgentAlgorithm)。盲搜索算法的主要目标是控制查询规模,降低冗余开销,但现有算法缺少对网络状况的感知能力,难以自适应地根据查询及网络情况调整查询规模。QAA通过查询代理不断发出子查询来完成查询工作,其核心思想是通过子查询探测网络状况,再利用这些信息指导后续子查询规模,从而有效降低冗余开销,其规则是:离查询成功越近,查询规模越小。利用这种探测过程,QAA避免了现有算法的参数优化难题。本论文将QAA与现有盲搜索算法进行了对比实验,结果表明,对uni-uni模式及Zipf-sqrt模式,QAA即使在高查询满足率条件下,也实现了有效冗余开销控制,其结果冗余率分别为1.1和1.4,是几个实验算法中最低的,并且两个模式下的结果冗余率提高也是最低的,这说明QAA有更好的网络适应性。2)提出了一个基于缓存生命期(TTL)的分布式索引缓存模型。分布式索引缓存方法的基本思想是以较低代价扩大网络中信息数量,以此提高网络搜索性能,因此索引缓存密度在影响对等网络的搜索性能上占据核心地位,但目前对此的研究工作还很少见报道。本论文分析了查询到达对缓存索引扩散的驱动作用以及缓存生命期超时对缓存索引的消灭作用,发现网络索引缓存密度在这两个因素影响下可以维持一定的稳定状态,这意味着,可以通过一些简单的参数来模型网络搜索性能。基于上述发现本论文研究了两个具代表性的基本节点发现算法——Gnutella算法与随机漫游算法,其分别具有最短和最长的缓存路径。我们研究了这两个算法的索引缓存密度如何受查询到达速率以及缓存生命期时长的影响,发现在Gnutella算法下,查询到达速率及缓存生命期时长对缓存密度表现出明显的线性关系,而在随机漫游算法下,表现出幂指数关系。