基于Solr的分布式搜索引擎研究

来源 :中国计量大学 | 被引量 : 4次 | 上传用户:zxwss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通系统智能化的快速发展,设施设备特别是卡口数量的快速提升,使得过车记录飙升,形成大规模数据。卡口系统中,用户常常需要对车牌号进行精确或模糊查找,同时要求数据检索系统尽可能地可靠、及时且高效。在记录数上亿的这种大数据量且高并发的情况下,传统的检索引擎没有办法保证实时响应,从而导致查询效率低下,严重影响到用户的体验。为弥补这一不足,通过搜索应用服务器为云存储数据库创建索引应运而生。创新点一:本论文以交通行业内的海量过车数据为背景,在Solr开源搜索引擎基础上,提出了一种分布式搜索系统,针对交通行业内的记录必然包含着时间信息,且时间信息往往是用户在查询和排序时的主要依据等特点,本论文针对查询性能的优化,拟从创建索引、合并索引、查询索引和结果排序等四个方面优化搜索应用服务器,提供高效率的检索服务,以提升搜索应用服务器在交通行业内的应用能力,保证快速响应的需求。创新点二:因为Solr的索引处理采用了主从式的复制集群进行部署,本文提出一种主从节点分配的改进算法,以保证搜索引擎服务器集群的负载均衡尽量处于平衡的状态。当出现集群中某台服务器无法工作的情况时,能自动实现主从节点的重新分配,在该服务器恢复正常工作时,恢复负载均衡,使得每台服务器性能的利用更加合理。实验表明,上述两种改进优化从搜索引擎的查询检索性能方面,在大数据量级(亿级至十亿级)下,都极大地提升了其系统的查询响应时间,同时具备优秀的负载均衡能力。
其他文献
混沌遗传算法是一种基于遗传算法和混沌算法的混合算法,不仅具有遗传算法的并行性、整体优化性的优点,还具有混沌算法的遍历性、初始值敏感性、可预测性、结构内部有序性的优
作为信息中心网络(Information Centric Networking,ICN)的研究热点之一,命名数据网络(Named Data Networking,NDN)的发展受到了越来越多的研究机构以及研究人员的关注。无论
随着P2P网络的发展,它在对等计算、协同工作、内容共享等领域都有非常广泛的应用。但是P2P应用的增加必将产生大量的数据请求和数据传送,而这会造成网络拥塞等一系列问题,进
农业模型是农业数字化建设的核心。农业模型研究与应用的不断深入与发展对农业模型的开发方式、复用质量和效率、模型管理等提出了更高的要求。随着基于组件的软件开发技术的
随着信息化的发展,公安部门积累了大量的历史数据,但对这些数据的分析利用程度较低.数据仓库的目的是建立一种体系化的数据存储环境,应用联机分析处理技术(OLAP)提取用户感兴
随着市场竞争越来越激烈以及计算机技术的发展,信息化已经成为各个产业的必然要求。企业商业活动中对信息的获取、加工、处理的要求越来越高,传统的操作型信息管理系统已经难
数据挖掘是从大量的数据集中提取隐含的、未知的、潜在有用的知识的过程,是数据库研究最活跃的领域之一。而孤立点检测是数据挖掘中的重要研究分支,其作用就是发现数据集中的
近年来,随着计算机网络技术的不断进步,以P2P网络、Ad hoc网络为代表的一类新型网络迅速发展起来。这些网络往往由理性的自治节点通过自组织方式相互连接而成,故可统称自组织网
区域医疗协同是卫生信息化经过医院管理信息化、临床管理信息化两个阶段后新的发展需求,其目的是使分散在区域内不同医疗机构的卫生数据得到充分的共享,有效的整合数据资源,
学位
无线传感器网络由大量的微型、廉价、低功耗的传感器节点组成。这些传感器节点不仅能够探测包括地震、温度、湿度、噪声、光强度、压力、土壤成分、移动物体等多种多样的现象