基于动态结点流行度的B+树索引研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:lm4194
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化技术的发展和Web2.0时代的到来,数据资源的类型和规模不断扩大,社会发展已经进入到大数据时代。大数据时代的来临,给索引技术和数据库系统的发展带来了巨大的机遇和挑战。B+树索引是一种索引有序数据的高效索引方式,其在文件系统和数据库系统建立索引等方面起着重要作用。然而,随着数据规模的不断扩大,B+树发生结点分裂时耗费大量时间,并且其内部结点空间利用率较低,严重地影响了应用系统的性能。因此,设计出高效合理的索引结构,以管理和组织这些日益增长的数据显得十分必要。本文首先介绍了常见的几种索引结构,包括线性表索引、顺序表索引、散列索引和树形索引,着重阐述了树形索引结构中的B-树索引和B+树索引。在比较分析B-树和B+树索引机制的优缺点的基础上,结合当前大数据时代的背景,针对经典B+树索引机制出现的查询性能下降和空间利用率低的问题,提出了一种基于动态结点流行度的B+树索引结构-DNCPB+-tree(Dynamic Node CachePopularity B+-tree)。该索引结构通过修改经典B+树的内部结点结构,提高其空间利用率;通过在叶子结点引入流行度参数和在内部结点动态缓存访问频率较高的叶子结点信息,提高其查询性能。最后实验采用SQLite开源数据库平台,分别就平均I/O开销和查询响应时间对DNCPB+-tree索引和经典B+-tree索引进行对比分析,以验证DNCPB+树索引机制的有效性。实验结果表明:与经典B+树索引机制相比,尽管DNCPB+-tree的查询操作会有额外的时间开销,但仍具有较好的查询效率,查询响应时间平均提高了18%,同时提高了空间利用率。
其他文献
随着现代信息技术的飞速发展,“信息爆炸”产生的危机日益殃及个人信息管理,信息的爆炸性增长使人们日常需要处理的信息量迅速增长。用户面对浩如烟海的信息世界,往往无法快速准
智能移动机器人的研究课题在近年来越来越受到国内外各大科研机构和研究学者们的青睐,其中,目标识别和自主定位问题是实现机器人智能化和全自主的主要任务。各种识别算法和定
随着Web技术的逐渐成熟以及快速发展,越来越多的用户可以通过互联网访问自己想要的信息。因此,用户通过互联网所能获取的信息量呈指数级的速度增长。互联网中的海量信息一方面
水泥是经济建设过程中的基础性原材料,近年来我国水泥工业发展迅速,水泥产量居世界第一。水泥产量的不断增加带来了高能耗问题。为了响应节能减排的号召,我国水泥行业急需进行产
随着计算机网络的爆炸式发展,如何保障网络安全成为人们亟需解决的问题。入侵检测系统在网络安全方面发挥的积极作用使它成为人们关注和研究的焦点之一。虽然人们已经将数据挖
双目立体视觉是计算机视觉领域的一个重要分支,它是使用两个摄像头采集立体图像对,然后根据其中包含的几何关系恢复出场景的三维信息,该技术不管是在军事、工业,还是民生等领
核方法即为基于核的机器学习方法具有两个显著的特点:(1)在线性与非线性之间建立了一座桥梁,从而可以把求解线性问题的方法用于求解非线性问题;(2)核函数的引入巧妙地避免了维
千百年持续不断艺术创作保存下来的敦煌壁画,对于研究绘画发展具有重要意义。本文将非真实感渲染技术和敦煌艺术相结合,借鉴敦煌研究院整理的资料,生成具有敦煌风格的艺术作品。
随着社会老龄化的加剧,环境问题的日益突出,人们对自身健康信息越来越重视,对自身生物信号的智能化采集和监控的需求,已经出现爆发式的增长。但是,传统的生物电信号采集设备(心电图
随着电子商务技术的蓬勃发展,Internet逐渐成为服装业一个引人注目的销售渠道。但是,服装的自身特点决定了其无法用规格、文字以及照片等方式准确地将特征信息描述清楚,导致了消