云环境下数据模型和索引技术研究

被引量 : 0次 | 上传用户:whsdht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网技术的迅猛发展,数据量急剧膨胀,传统的数据模型和索引技术已经无法满足大数据管理的需求。因此,对这些海量数据进行有效的管理就成为传统数据管理面临的主要挑战。作为一种新的计算平台,云计算一经提出就吸引了学术界和企业界的广泛关注。针对云计算应用的特点和需求,借鉴传统数据管理技术的理念,研究面向云计算环境的数据模型和索引技术己经成为一个重要的研究课题。本文主要作了以下三个方面的工作:(1)介绍了云计算的基本概念、特点和发展,并重点总结和分析了现有云环境下的数据模型相关技术和索引技术的研究现状。(2)针对云环境下典型的key-value数据模型无法有效支持用户的多种查询方式,如范围查询和非主键查询等,本文提出了一种基于P-Ring的改进数据模型Key-MultiValue。Key-MultiValue通过将key-value中value的属性进行分解,并按照查询热度动态改变所分解的属性以支持非主键的查询。另一方面,为了支持范围查询,本数据模型采用P-Ring结构对数据进行分区,同时为了解决P-Ring没有考虑到各个存储节点自身性能差异的不足,引入了节点性能状态参数。最后通过实验及结果分析表明,本数据模型能够有效支持范围查询和非主键查询,提高了查询成功率和查询吞吐量。(3)现有云计算平台大多支持简单的基于主键的查询,无法高效地支持相似性查询,且随着数据维数的增大,现有树型索引易造成维数灾难问题。针对上述不足,提出一种新的索引结构:VF-CAN。VF-CAN结合了基于路由协议的内容寻址网络(Content AddressableNetwork,CAN)和改进的矢量近似文件索引(Vector Approximation File,VA-File)。该索引架构采用全局索引和局部索引两级索引模式。局部索引使用改进的VA-File,即对VA-File的近似矢量按照距离相近程度进行k-means聚类。在全局索引中,以覆盖网CAN组织存储节点,为减少成本估计代价,只将局部VAK-File索引的聚类信息通过CAN接口公布到整个覆盖网络。最后通过实验结果及分析表明VF-CAN提高了系统的吞吐量,有效地提高了数据的查询性能。
其他文献
南丰傩舞作为舞蹈史上的活化石,是经历了上千年的文化积淀传承而形成的。然而,在现代文明的冲击下,南丰傩舞面临着传承生境恶化,后继人才匮乏,专项保障资金不足,相关政策缺失
在江西省婺源县傩舞艺术的传承中,被大家所熟悉的当属长径村傩舞艺术团,它是婺源县现今唯一一个生存于乡土民间并能够坚持每年举行傩仪的班社。该傩舞社团在2005年江西省举办
21世纪是一个以创新为主的知识经济时代,而创新必然是这个时代企业维持生存并获得竞争优势的关键。如果企业没有一定的创新能力,就无法跟上技术的进步,也难以满足顾客的需求,
目的实现病人床边护理工作的信息化管理。方法以无线局域网为平台,以Web Service技术作为数据交互手段,通过手持终端设备与医院现有的医疗信息系统(HIS)进行安全的数据交换和
高校后勤是高校重要的组成部分,高校后勤工作是学校教学和科研的基础、保障和先行者,它直接关系到高校教育事业的发展和稳定。而高校后勤管理人员的素质决定着高校后勤管理水
虎潜丸始栽于《丹溪心法》卷三,具有滋阴降火、强壮筋骨之功效。临床常用此方治疗消渴病后期,肝肾不足,阴虚内热,精血日耗,奇经暗损,蹯脉失用,并发肢体无力等症,每获良效。
<正>拥有2300多年建城史的吉林省四平市,不仅是满族文化发祥地之一,燕国城遗址还是汉民族最早开发东北的见证。四平还是一座英雄的城市,中国革命战争时期,这里因进行过惊心动
本文研究中国股票市场的周内效应。首先分析上证180指数、巨潮大盘指数、上证中小指数和深证500指数这四个指数的统计性特征。其中前两个指数代表较大和较成熟公司,后两个指
2009年,我们科学谋划湖北林业发展思路,确立“生态立省”发展战略,突出产业发展,采取两手抓,促进生态建设和产业发展良性互动。在林业产业发展上,我们打破常规做法,吸取其他行业建设