论文部分内容阅读
该文从搜索引擎技术开始,全面研究了专题搜索引擎的基本原理和相关技术,并设计实现了针对城市公交系统的专题性搜索引擎,该搜索引擎主要以Heritrix爬虫框架为后台支撑,利用Lucene软件进行文本索引,最后将搜索获取的因特网信息放入Excel表中,同时利用设计的客户端程序为用户提供关键词搜索功能;最后,阐述了设计过程中为提高专题性搜索功能所设计的几种核心方法。