基于FD-tree的闪存数据库索引技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yangbao_2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
闪存由于高效的随机读、低功耗和无噪音等优点,被认为有望取代磁盘成为数据库的永久性存储介质。闪存一些不同于磁盘的I/O特性,使得传统的基于磁盘I/O的算法和数据结构,如B+树索引等,并不能直接应用到闪存上。由于树形索引是关系型数据库中重要的数据访问方式之一,对基于闪存的关系型数据库的性能有很大影响,因此许多工作都对闪存上的树形索引进行了研究。FD-Tree即是一种针对闪存所设计的索引树结构,针对闪存读写速度的不对称,FD-Tree将随机写操作转化为批量的顺序写操作,从而提高了索引的效率。然而FD-tree在实际的数据库应用中仍有明显不足。FD-Tree在初始化装载大量数据时,会进行多次的层级归并操作,产生了大量读写闪存操作,严重影响了系统性能。本文提出了一种新的FD-Tree装载算法,在进行层间归并时,将整层分为区间逐段归并,减少了I/O的次数。通过在真实闪存上的性能实验评测,证明了新装载算法在I/O次数和CPU时间上比普通的FD-Tree插入算法均有很大的提高,是一种实际高效的算法成果。由于FD-tree每层页面都是排好序的索引项,非常适合进行压缩。本文设计了针对FD-tree索引项键值的压缩算法,对索引项的键值,以及rowid字段均能进行压缩。压缩算法保持了FD-tree原有的各项操作的复杂度的情况下,能够带来很好的压缩率和查询性能的提升。通过TPC-H 1GB键值索引数据的测试证明,本文的索引数据压缩算法,能够为FD-tree索引节省约一半的存储空间,同时带来约20%到40%的查询性能提升。
其他文献
随着人类基因组计划(简称为HGP)在世界范围内的广泛开展产生了大量有待于分析与处理的生物学数据(DNA、RNA及蛋白质数据等),借助计算机技术对这些数据进行组织与处理是计算机
根据高职高专院校的具体情况,将数据挖掘技术引入招生领域,分析了数据挖掘的各种方法。采用决策树的分类方法,对历年的生源数据进行挖掘,对生源的性别、成绩、所属类别、特长
随着多核处理器的发展,为了解决多核处理器上编程复杂的状况,数据流编程模型被提出。现存的数据流编程模型中,主要使用的是完全静态的调度,虽然性能有很大提升,但是并不适用
随着计算机技术和网络技术的广泛应用,在新闻出版、医疗卫生、建筑设计等行业每天会产生大量的数字图像。如何有效地对这些图像进行分析、存储和检索是一个亟待解决的问题。
随着计算机视觉技术的发展以及人们对新的交互手段的需求,基于计算机视觉的交互系统(如手语、人脸、表情、唇读、头势、体势等)便逐渐发展起来。其中手势完全可以作为一种手
多处理机系统中引入虚拟化,会带来很大的优势——多处理机系统使得虚拟化技术能够应用更多原本可能会被浪费的处理器周期和计算资源,从而实现集中化计算和资源的动态分配,充
Internet上数量不断激增的网站,使得人们上网的起点,从默记的网址,演变为网站黄页,又被搜索引擎所替代。但以搜索引擎为核心的日常网络生活仍不够便捷。iGoogle, Yahoo!和AOL
P2P网络是近年来的研究热点,如何在分布广泛、数量庞大、节点行为不可控制的复杂环境下实现高效的检索服务是P2P应用面临的巨大挑战。目前的P2P资源检索一般仅支持简单的关键
随着万维网的迅速发展,越来越多的组织、公司等在万维网上发布已发现的软件安全缺陷信息。本文研究基于垂直搜索技术从网上获取软件安全缺陷信息,并进一步基于语义标注抽取该
移动数据的管理在时空数据库领域占有十分重要的地位,移动数据的运动在数据结构上往往以轨迹的形式体现,之前的针对轨迹数据管理的大多数研究工作主要集中在欧几里得空间下展