论文部分内容阅读
本文对搜索引擎技术进行了深入的研究,并且探讨和实现了搜索引擎在企业中的应用。分析了当前的几种中文分词技术,并在此基础上设计出了自己的中文分词算法,该算法达到了很好的中文分词效果。最终,利用Lucene和自行设计的中文分词工具实现了企业搜索引擎。全文的主要内容是:
一、对搜索引擎的原理和组成进行了研究。
二、由于搜索引擎在迅速激增的企业内部信息资源中的使用越来越重要,提出了针对企业信息的专业搜索引擎:企业搜索引擎技术。
三、研究全文检索技术和中文分词技术,在研究前人的分词技术的基础之上,基于开源全文搜索引擎Lucene,实现了一个自己的中文分词算法。
四、设计并实现了一个基于Web的企业信息搜索引擎。