论文部分内容阅读
随着P2P技术的流行,出现了各种P2P系统,如用来交换音乐文件的Napster、用于普通文件交换的Gnutella。近年来P2P网络中资源越来越多,P2P搜索技术成为研究热点。目前的P2P搜索大部分仅仅针对文件名、作者等有限的信息进行检索,使得搜索结果的准确性比较低。而且由于这些P2P系统大多数是用来实现一个单一类型的网络服务,使得各个系统之间通信相隔离。本文的目标就是在提高搜索准确率的同时,设计更加通用的P2P搜索系统。
Sun公司的JXTA是开放的对等网络开发平台,它由一组独立的网络协议组成,用户可以在此基础上根据需要开发应用实例。Lucene是优秀的全文检索工具包,可以对需要检索的文件、字符流进行全文索引。本文在国内外已有的研究成果及应用情况的基础上,结合JXTA和Lucene优点,提出基于JXTA网络的全文搜索系统,并在实际环境中,实现了系统功能。
本系统针对一般P2P系统只能对文件名、作者等少数信息进行搜索的缺陷,提出了全文关键字搜索这个思路,建立了文件共享和文件搜索模型,以提高搜索的准确性;系统通过对共享文件建立索引,减少了搜索的响应时间,提高了系统的效率:对搜索查询语句进行分词处理,这使得系统能得到更多有效的搜索结果。基于JXTA和Lucene,本文实现了基于JXTA对等网络全文搜索系统,并且对系统运行结果进行分析。