基于hadoop和hbase的分布式索引集群研究

来源 :信息技术与信息化 | 被引量 : 0次 | 上传用户:chouyez
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,搜索引擎要处理的数据量越来越大,为提高信息检索效率,避免传统索引的创建和维护效率不高的情况,设计了一种基于Hadoop分布式索引集群和Hbase分布式查询数据库的解决方案。利用Hadoop的分布式计算和存储框架,采用分布式倒排索引算法,分词并建立索引表,最后存储到Hbase中。通过实验证明了基于Hadoop的分布式索引集群在数据处理方面的优势。
其他文献
随着互联网的不断发展,城市数据、企业数据、医疗数据、网站数据成为我们虚拟与现实生活的重要组成部分。据2015年7月中国互联网络信息中心(CNNIC)最新发布的《第36次中国互联网
摘 要: 翻转课堂是当前国内教育界的研究热点之一。随着信息技术与教育行业的深度融合,教学活动的组成要素出现了许多新的特点。为适应教学要素的新特点,并解决计算机基础课程教学中存在的问题,引入翻转课堂教学模式,并在高职计算机基础课程中进行实证应用。实践表明,翻转课堂教学模式有效地解决了课程教学中出现的问题,并为同类课程的教学改革提供了参考。  关键词: 翻转课堂; 高职; 教学要素; 计算机基础  中
本文分析了包头市新型农村牧区合作医疗管理中心信息系统的现状,重点分析了信息系统在新农合医疗保障中的作用,并提出了不足,针对不足提出了具体解决措施,以帮助调整和完善信息化
随着科学技术的不断进步,新的技术和机械设备也在不断开发出来,而新的技术和设备是为了服务于与各行各业而产生的。道路作为现今社会不可缺少的部分,遍布各个地区和国家,而对
鉴于普通高压变频器存在着输出电压稳定性低,效率低,波形的谐波含量高等缺点,本文利用MATLAB/Simulink软件搭建了H桥级联式多电平高压变频器,并对其进行了仿真研究,通过结果分析验证了H桥级联式多电平高压变频器具有输出的相电压的阶梯数目较多,波形近似为正弦波,电压变化率比较小,稳定性较高、效率较高等优点。
为贯彻落实《“十二五”国家战略性新兴产业发展规划》、《关于促进信息消费扩大内需的若干意见》,提升我国云计算创新发展水平,国家发展改革委、财政部、工业和信息化部、科
针对高校ERP课程教学的现状,提出基于"4+1"的五元教育模式建立完善有效的ERP课程教学体系,以提高ERP课程的教育质量。文章探讨了ERP课程在教学过程中的问题及现象,分析了问题产
糖尿病肾病是终末期肾病的主要病因之一,临床以蛋白尿和肾功能逐渐下降为特点。Kimmelstiel及Wilson首先从组织病理上描述了糖尿病肾病的肾小球系膜基质增加为主要的损伤,而且
聚氯乙烯作为世界第二大合成材料和最大耗氯有机化工产品,在国民经济中占有重要的地位。我国是世界第二大聚氯乙烯生产国。为了解聚氯乙烯生产过程中的主要职业病危害和防护设
以云计算在桥梁健康监测系统中的应用为背景,从安全角度分析了云计算系统面临的风险和威胁,介绍了桥梁健康监测云计算系统各层次的安全防护体系,阐述了云计算安全防护体系在云计算系统中的重要作用。