论文部分内容阅读
随着高校校园网的建设日趋成熟,校园网内部的数据信息量大幅增长,为了提高信息检索的准确性和效率,本文在研究垂直搜索引擎的相关原理、技术和实现过程的基础上,探讨如何利用开源的Heritrix爬虫工具包、Lucene全文搜索工具包、JE-analysis中文分词组件和Htmlparser解析工具包实现校园网搜索引擎系统。