论文部分内容阅读
本文研究了在分布式环境下如何构建全文检索系统.Lucene全文检索技术是信息检索领域广泛使用的基本技术,它是一个优秀的开源全文本搜索技术框架.Hadoop不仅是一个用于存储的分布式文件系统,而且是用来在由通用计算设备组成的大型集群上执行分布式应用的框架.本文首先介绍这两种开源工具,然后将其引入具体应用,给出了一个基于Hadoop的分布式的全文检索系统模型.