基于HBase的多维索引及维护方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:h120568
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的快速发展以及互联网应用的普及,数据规模不断扩大,我们已经进入了大数据时代。尽管传统的关系数据库管理系统(RDBMS)可以提供非常成熟的数据存储和处理方案,但是面对不断增长的数据量,RDBMS分析和处理大数据的能力在可扩展性方面遇到了严重的瓶颈,No SQL数据库应运而生。它使用灵活的数据模型存储大数据,可以很容易地实现扩展性,因此诸如HBase之类的分布式存储系统在数据服务中发挥着重要作用。为了更好地处理和分析大数据,一维辅助索引已被用来访问许多分布式存储系统中的数据。但是,它不能通过简单地聚合多个辅助索引有效地支持多维范围查询。因此,本文提出了基于HBase的一种自适应多维索引策略来有效地执行多维范围查询操作,该策略联合了B+树和Hash表,首先根据要查询的属性建立B+树辅助索引,然后将索引查询得到的相应行键集合映射到Hash表以获得最终匹配结果。实验结果表明,我们的索引策略可以获得较低的响应时间延迟,并且在八维查询条件下,混合索引的响应时间比迭代索引减少了15.75%左右,比MD-HBase方法减少了39.82%左右。针对HBase更新索引时引起的一致性与性能之间的平衡问题,已有的更新策略只注重提高性能,而不关心索引结构和数据表之间的一致性,因此本文结合LRFU算法设计了冷热数据划分策略,并提出了基于HBase的冷热数据自适应多维索引维护策略,异步更新冷数据及其对应的索引并使用查询验证机制,同步更新热数据和索引,从而在一致性和性能之间实现自适应平衡。实验结果表明,自适应维护策略的一致性比异步简化策略强,且两者性能接近。
其他文献
图示法是把题意用简略图的形式直观表达出来,便于直观分析和比较,有利于提高学生分析问题和解决问题的能力,对学生思维的敏捷性和逻辑性有较好的培养作用。本文以四个实例分析讲
随着经济全球化和社会一体化的发展,新的管理思想层出不穷,社会需要懂管理学知识并熟练掌握英语的复合型人才。管理学英语作为行业英语的重要组成部分,日益受到人们的重视。
<正> 近几年来,SOI(silicon on Insulator)材料因用于制备抗辐照、高速CMOS电路及三维集成电路等受到人们越来越多的关注。在各种SOI技术中,离子注入形成SOI材料有其独到的优
锦屏一级水电站为目前世界最高双曲拱坝,大坝基坑上游面处于基坑f18断层带,岩石地质条件差,岩面渗水严重。本文介绍破碎岩面渗水处理措施,主要采用化学灌浆和固结灌浆相结合的方
贝克特是20世纪以来文坛和戏剧界的一颗璀璨的明星,近年来,我国的贝克特研究在学术界取得了长足的发展。本文回顾了我国近年来贝克特研究的历史与现状,分析了国内贝克特研究的主
本文以绘画创作中“朦胧”意趣表现为出发点,通过对“朦胧”的研究与分析,从而获得新的绘画认知,更好地引导实践创作,寻找出自身新的绘画切入点。清晰反映一种形式的美感,朦
随着双创浪潮的到来,孵化器行业迎来了发展的高峰,各种新型孵化器纷纷涌现,它们的运营模式灵活多样,这给作为传统型孵化器的上海A大学科技园孵化器带来了前所未有的挑战,其原有的传统运营模式急需改进。本文以上海A大学科技园孵化器为研究对象,以其现有运营模式为具体研究内容,首先通过国内外孵化器理论文献的整理对核心概念进行界定,利用PEST模型、SWOT模型分析工具对孵化器现有的内外部战略环境进行分析,然后采
目的探讨抗性淀粉干预糖尿病大鼠对其子代糖代谢的影响。方法 20只6周龄雌性2型糖尿病Goto-Kakizaki(GK)大鼠随机分为抗性淀粉组(GK-RS组,n=10)和等能量密度饲料对照组(GK-EC组,n=
当读者诸君读到这篇文章的时候,我和妻子将要迎来我们结婚一周年纪念日。毫无疑问,庆祝结婚一周年对我们夫妇俩来说特别重要。可是,我亲爱的朋友和忠实的读者们为何对此特别有兴
摘 要:做好初高等数学承接教学工作,使大学生尽快掌握高等数学的学习方法。针对初高等数学教学现状,给出承接初高等数学教学的方法,即注重教师的引导工作,培养学生学习数学的兴趣,指导学生适应新的学习模式,提高自学能力,为学好高等数学夯实基础。   关键词:初高等数学;教学方法;学习观念   随着科学社会化的发展,各行业间的联系日益紧密,教育改革逐渐趋于培养应用型全面发展的人才。高等数学无论作为专业必修