基于Lucene的全文检索系统的研究与实现

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:huxiaoshenshan2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术。它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源。文中阐述了建立全文检索系统的必要性,介绍了全文检索系统的概念并分析了Lucene的系统结构和实现机制,最后结合实际应用背景从系统设计、文挡抽取、索引的建立及执行检索等方面介绍了全文检索系统的实现过程。实践证明,该系统的查准率、查询速度等均达到了设计要求。
其他文献
先进音频编码(AdvancedAudioCoding,AAC)以其多声道、多采样率、高压缩比、音质好等特点被广泛使用。文中首先介绍了MPEG-2/4AAC音频编码技术;接着基于MPEG-2/4AAC音频编码原理,开发
随着网络日新月异的变化,为了进一步保障校园网的安全,规范和审计师生的上网行为,保证学校对上网人员的可控性,文中研究了计费网关系统及目前计费网关系统在校园网出口的实现
针对虚拟社区中成员身份不真实、成员之间关系模糊、社团结构禾知的特点.提出基于空间和时间对虚拟社区进行社团划分的两种算法,最终在线了社团内部成员之间的交互关系和社团之
视频流传输控制对于提高网络服务质量具有重要意义。分析了MPEG视频流编码和传输特性,通过引入流间优先级和流内优先级机制,提出了一种基于优先级区分的视频流传输控制算法(PD
针对当前基于信息增益和粗集属性约简作为属性选择标准建树算法存在的不足,以粒划分方法为理论基础,将属性按其取值划分为若干属性粒,提出以属性粒的长度量和其所对应决策属性的
为了更好地解决在机器学习和数据挖掘等领域中经常遇到的两个概率密度函数的比值估计问题,文中提出了一种新的概率密度比值估计算法。该算法基于Kullback-Leibler距离,综合混
针对基本粒子群算法在求解火力打击体系目标分配问题时易陷入局部极值、计算精度差的局限性,提出了一种基于混沌粒子群算法(ChaosParticleSwarmOptimization,CPSO)的目标分配优化
为了挖掘隐藏在惯性仪器测试数据背后的信息知识,解决数据丰富而知识贫乏的问题,运用数据挖掘技术筛选出典型的故障测试数据,借鉴CRISP—DM行业标准并以Clementinel2.0为平台进行
为了解决网页信息的自动抽取,该文提出了一种基于视觉特征和领域本体的Web信息抽取算法。该算法以基于领域本体的信息抽取为基础,根据网页的视觉特征来准确划定信息抽取区域,
基本蚁群优化算法在信号的盲均衡处理中存在收敛速度慢、容易陷入局部最小的缺点。为了解决基本蚁群算法所存在的不足,文是通过修正基本蚁群算法的转移概率公式给出一种改进