大数据分布式全文检索系统的设计与实现

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:xzlanxing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文是基于一种开源企业搜索引擎Solr实现对大数据分布式数据库HBase中数据的检索。论文简单地介绍了分布式存储技术HBase和分布式索引技术SolrCloud,实现了基于Solr和Zookeeper的分布式搜索方式SolrCloud模式对HBase表的索引的建立。该系统通过python程序在对HBase中的Rowkey建立索引的同时还对每列数据都建立索引,实现了Hbase的二级索引,克服了HBase只能通过Rowkey单一查询的不足。经过反复测试,充分地表明了基于Solr的分布式搜索系统的高效性及高可靠
其他文献
【正】 我国教育的不上轨道,原因固极为复杂,而教师的缺乏专业精神或为其中主要原因之一。学校应以儿童为中心,此乃就学校中一切设施着想,若就学校之发展,学校之前途而论,教
期刊
针对无纺布疵点在线检测实时性问题,采用了一种基于CUDA并行技术的二维Gabor滤波优化检测方法;该方法基于无纺布的纹理特性确定采用的三个尺度和四个方向的滤波器组参数,取Gabor滤波器的实部进行计算;并在GPU上并行实现该算法;实验结果表明,该滤波算法能检测出疵点,CPU和GPU的异构并行计算模型大大提高了计算效率,满足了在线检测实时性要求。
针对二进制分辨矩阵无法处理连续型数据,提出一种基于邻域的改进二进制分辨矩阵及其属性约简方法。实验结果表明,与先数据离散化,后属性约简的方法相比,利用文中方法提取出的
目的探究人性化服务在糖尿病护理中的应用效果。方法选取于2016年11月—2017年7月就该院治疗的糖尿病患者78例进行研究,通过给予患者不同的护理服务将其分为对照组与研究组,
针对城市交叉路口交通流量不对称,对称的信号配时易发生交通流量大的方向发生拥堵的情况,采用借相位放行方式设置交叉口的不对称相位,以交叉口车辆平均延误最小为控制目标,应用改
结合ECC密码体制优点和有限域上离散对数问题,提出了一种基于混沌映射的混合安全双向认证密钥协商协议。协议基于有限域上切比雪夫多项式的半群特性,运用ECC密码算法隐藏通信
目的分析手术室细节护理在确保手术室糖尿病患者护理安全中的应用价值。方法2018年2—9月开始手术室细节护理质量改进活动,共处理患者104例,纳入改进后。2017年2—10月,医院
为了使第四届“全国中小学外语教师园丁奖”的评选工作公正、公平、及时地开展,特制定本评选细则,供各地评委会采行:
期刊
《关于修改(建设项目环境影响评价分类管理名录)部分内容的决定》已于2018年4月28日经生态环境部第3次部务会议通过,现予公布,自公布之日起施行。关于修改《建设项目环境影响评价
2018年5月4日财农[2018]21号有关省、自治区、直辖市财政厅(局),扶贫办:为贯彻落实党中央、国务院关于打好精准脱贫攻坚战的决策部署,进一步加强和规范中央专项彩票公益金支