论文部分内容阅读
随着互联网的快速发展,互联网上的信息量表现出资源动态变化、资源形式多样化、互联网结构复杂化等新的特点,传统的搜索技术显得力不从心,基于对等网络的新一代搜索技术的提出为互联网搜索提供了新的思路。基于对等网络的搜索技术可以达到传统搜索技术无法达到的广度和深度,具有更高的命中率和有效性。本文首先介绍了对等网络搜索技术产生的背景和研究现状,接着对传统搜索技术和基于对等网络的搜索技术做了详细分析,指出它们各自的优缺点。其次,介绍了对等网络搜索技术的四种拓扑结构:集中式对等网络、完全分布式非结构化对等网络、完全分布式结构化对等网络以及混合式对等网络。对结构化对等网络和非结构化对等网络做了详细介绍,并对基于泛洪的非结构化对等网络搜索技术随机漫步等搜索算法和基于分布式哈希散列表的结构化对等网络搜索技术内容寻址网络等经典对等网络搜索算法做了详细的分析和对比,总结出各自的优点和不足。在此基础上,本文提出了基于分布式后缀树的覆盖网搜索技术,利用后缀树算法在对等网络中构造出分布式后缀树覆盖网。分布式后缀树覆盖网具有很好的复杂关键字序列查找能力。它建立在分布式哈希散列表覆盖网基础之上,首先通过分布式哈希散列表获取相关的数组,然后再返回给分布式后缀树覆盖网,分布式后缀树覆盖网使用所获得的数组进行进一步的处理,从而实现响应客户端给出的关键字序列查找请求的功能。基于后缀树的对等网络搜索技术对于词汇之间的语义顺序有一个很好的体现,在对等网络中对于大规模分布式文档的搜索是十分高效的。