论文部分内容阅读
近年来随着Internet的飞速发展,网络带宽的成倍增加以及计算机计算能力的大大提高,对等网络引起了来自工业界和学术界越来越多的关注。对等网络通过对等和分布式的方式,在网络中不同节点间提供空闲的CPU处理能力,磁盘空间以及网络带宽的共享。同任何大规模的分布式系统一样,对等网络系统成功与否不仅仅在于其网络结构的合理和有效,在很大程度上取决于其资源查找机制的灵活性和可扩展性。国际上许多一流的大学和研究机构都在积极从事这方面的研究,国内的相关研究则起步较晚,本文将系统介绍作者在攻读博士学位期间进行的有关对等网络有效搜索机制的研究及取得的一些成果。除了采用中央目录服务器的集中式对等网络之外,从网络拓扑上对等网络大致可以分为无结构对等网络和基于分布式哈希表的结构化对等网络。无结构对等网络采用类似泛洪的盲目搜索机制,虽然可以支持灵活的查询,但搜索的效率和可扩展性都较低。结构化对等网络依据文档标识符进行查找,可扩展性和查找效率都很高,但不能直接支持多关键字的搜索。本文首先提出了无结构对等网络中基于兴趣域的搜索模型,文档通过元数据进行描述,元数据采用RDF框架以提供对文档更丰富灵活的描述。保存相同元数据的不同节点同属于一个兴趣域。搜索请求在兴趣域中进行传播可以大大提高搜索效率。通过元数据选择窗口和元数据复制机制可以进一步提高搜索的效率。模型分析和模拟实验验证了基于兴趣域搜索模型的有效性。之后提出了结构化对等网络中多关键字搜索模型,通过在简单多关键字搜索模型基础上引入多关键字关联的搜索模型可以大大降低多关键字搜索对网络带宽的消耗,模拟实验也验证了这一点。提出的基于文档元数据完全表达式的多关键字搜索模型以节点存储空间为代价,可以只访问单个节点完成多关键字搜索,并进一步提出了基于关键字插入路径后退的负载均衡机制。最后提出了基于语义的任意拓扑对等网络搜索模型,通过将语义搜索层和对等网络层分离实现更灵活的搜索功能。提出了文档语义描述符的概念,用于进行搜索请求的匹配和路由。提出了文档语义子空间的概念,通过和文档空间的分离实现搜索与网络拓扑无关。为了进一步提高搜索的性能,提出了查询历史机制和沿途语义描述符缓存机制,减少了搜索过程访问的节点数目并增大了搜索成功概率,模拟实验验证了这些机制对搜索性能的改进。