论文部分内容阅读
搜索引擎是随着世界范围内的Internet的发展而产生的。但是,由于Internet以及后来出现的WWW技术的迅猛发展,导致其所蕴涵的信息量急剧地膨胀。面对当前如此庞大的信息数据,而目前普遍采用的是基于中心服务器的传统搜索引擎,所以在实际应用过程中很难准确、有效、快速地查找用户所需的信息。因此,搜索引擎技术急需进一步的发展和完善来适应新形势的变化。 本文主要探讨了采用新的信息检索模型—P2P分布式检索模型,来增加搜索引擎系统的规模并改善了它的性能。论文首先分析了传统的搜索引擎技术的关键技术、发展趋势和面临的挑战,由此引出将先进的P2P理念与传统的搜索引擎技术的相结合的新方法,顺应了搜索引擎技术趋向分布式、本地化方向发展的趋势。采用这种新的基于P2P分布式的搜索模型构建的搜索引擎系统,与现有的基于“网络蜘蛛”的搜索引擎相比较,在搜索到的信息的即时性、搜索到的内容的深度、搜索到的内容的范围广度以及搜索到的结果的精度和效率方面都有较大的改善空间。 在本论文的设计中,针对当前的各个P2P系统的不能相互兼容的问题,采用Sun公司的新一代通用P2P开发平台JXTA,并在此基础上构建了基本的P2P搜索网络,定义了位于搜索网络之上的基于JXTA的搜索引擎系统所需要的服务规范以及实现,构建了一种具有高度扩展性的本地化搜索引擎系统模型,同时也为有效的提高搜索引擎系统的规模和性能探讨了一条可行之道。 P2P搜索引擎的研究在国内外尚处在理论探讨阶段,目前并没有较为成熟的商业应用。本文提出的基于JXTA的P2P分布式搜索模型构建搜索引擎系统的方法,为今后设计和开发具有较高实用价值的P2P搜索引擎系统进行了实际意义上的探讨。