基于Solr的分布式全文检索系统的研究与实现

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:sabot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当前网络信息资源的急剧膨胀,传统的检索系统已经难以在处理海量数据时提供高效的、可靠的服务。针对该情况,设计并实现一个基于Solr的分布式全文检索系统。系统通过网络爬虫抓取网页信息,将抓取的信息储存为文本文件;然后利用Solr索引处理模块,在多台计算机节点上并行创建索引,有效地提高系统建立索引的速度;系统通过Zoo-keeper管理集群,将搜索模块设计为分布式,有效地提高检索性能;最后设计了友好的用户界面。目前,系统可以在百万数据量的环境下稳定运行,具有较强的实用价值。
其他文献
随着旅游业的发展,实现旅游信息的数字化管理日益重要。根据WebGIS技术的特点和TGIS的功能结构,从三亚市旅游业发展实际出发,构建基于ASP和WebGIS技术的三亚市旅游地理信息系
结合项目管理理论,以某水电厂计算机监控系统集成项目为例,阐述了项目成本控制的流程,即三个步骤:项目初期做成本预算,项目进行中做成本动态监控,项目后期做总结归纳。介绍项
社会发展动力理论,是唯物史观的基本原理之一。本文分析了马克思、恩格斯在论及该理论时所提出的"最后动力"、"直接动力"和"合力"概念,并阐述了正确认识该理论的当代意义。
《白氏宗谱》从明景泰五年(1454)修成,至民国三十七年(1948),先后续修十次,是一部精心修撰、保存完好的白朴家谱,它的记载是真实可信的。《白氏宗谱》内容丰富,纲目清晰,体例
北江白石窑水电站地处岩溶地区 ,坝基岩溶发育强烈 ,做好坝基防渗是其成败的关键。根据电站地质条件 ,对于泄水闸大溶槽段开挖至 8m高程 ,其下溶槽用混凝土防渗墙截断 ,墙下
简要介绍了土石坝测压管的结构、施工 ,讨论了土石坝测压管水位监测的常见问题 ,并提出了一些简单的处理方法 ,可供设计单位、水库管理单位参考
快速发展的高新企业面临严峻的人才抢夺战。人力资本是高新企业的关键资源,薪酬是发挥其人力资本优势的主要激励手段。“制度重于技术”,薪酬制度对高新企业的生存和发展至关重
针对全球气温升高、气候变化导致降雨发生变化、极端事件频发问题,选用珠江流域中佛冈县作为研究区域,统计了1960—2009年佛冈县50年逐日降雨资料,发现佛冈县年总降雨近50年
<正>经典古诗文是中华民族五千年光辉灿烂文化的瑰宝,不仅蕴含着丰富的文学历史学知识,还蕴含着非常优秀的传统文化思想,特别是中华民族的优秀传统美德。《语文新课程标准》
为了在东深供水工程实行自动化调控,以便向香港提供长期稳定的供水服务,有关单位对石马河的旗岭、马滩、塘厦和竹塘等4个梯级闸堰进行了泄流量的现场比测率定工作,以求得各闸堰