嵌入式内存数据库存储与索引算法研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:YOYO654321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
嵌入式内存数据库(Embedded Main-Memory Database,EMMDB)是一种能够构建及应用于嵌入式系统或者设备之上的,采用内存数据库(Main-Memory Database,MMDB)结构组织形式的小型数据库。它可以看作是嵌入式数据库(Embedded Database,EBDB)与MMDB性能上的融合,具有传统数据库无可比拟的优势和广阔的应用前景。   数据的存储和索引是EMMDB系统的核心技术之一,对其性能的优劣起着决定性的作用。本论文即对这两类技术的原理及发展趋势进行了深入的分析和研究。首先,根据传统的区.段式、散列、T树和B-树算法,实现数据存储和索引的各功能模块,将其应用在模拟Linux嵌入式系统开发平台的环境上测试并分析其性能。其次,针对EMMDB系统的性能要求,分别提出存储与索引的改进算法。一是在传统区-段式存储算法的基础上,结合类可扩散列思想提出的类可扩散列区-段式算法(EHAS)。该算法在段实存数据页内采用类可扩散列方法进行记录数据的定位,以记录的一个主键字段值取模得到定位关键值和三元组。二是在传统T树索引算法的基础上,结合B-树非叶子节点作多路分支目录的思想,提出具有优先匹配目录的T树算法(PMCT-tree)。该算法将T树划分为若干有父亲孩子关系的块,再提取各T树块阈值构造优先匹配目录(PMC),进而创建T树与PMC目录的关联关系构造索引。通过索引查询时先在PMC中定位到块再在该T树块中查找。   通过在Windows XP SP3上应用Netbeans6.0、Cygwin的模拟Linux嵌入式系统开发平台环境进行性能测试和分析,实验结果表明EHAS算法能够保持原算法较好的空间利用率,提高平均存储响应时间,且提供在一定条件下的常数级查询功能。PMCT-tree算法虽然由于增加了PMC目录而略多的占用了主存空间资源,但有效地加快了平均查询响应时间,且能保持较好的稳定性。研究表明,EHAS和PMCT-tree算法均是能较好的符合EMMDB性能要求的方法。
其他文献
互联网时代的到来,标志着我们生活方式的巨大改变。人们通过网络可以获取各种想要的信息。特别是伴随着Web技术由Web1.0向Web2.0逐渐过渡,金融领域信息开始在网络上进行集散,
数据仓库和OLAP联机分析系统提供了一些方法和工具来分析企业信息系统中的数据事务。但是,只有其中20%的信息是可以被OLAP分析系统分析。对于其他的80%的数据,大部分都是文件
粒子群优化算法作为一种新的智能优化算法,由于其收敛速度快、参数设置少,近年来受到众多学者的研究和重视。它常被用于解决大量非线性、不光滑和多峰值的复杂问题优化,现己广泛
“地震成像”领域的巨大进展是推动石油勘探工业的快速发展的主要动力。地震成像系统实现地震勘探结果的成像,便于地震数据解释人员、地质工程师等对地下地质构造、分层信息
人体运动中包含大量的情感信息,是情感识别领域新的研究方向。但是目前基于人体运动进行情感识别的工作基础薄弱,大多是人工判别或者提取一些基本物理运动信息作为特征量进行机
近年来,随着网络的大量普及以及各种技术的快速发展,互联网上的信息呈爆炸性增长。人们要在网上快速查找自己想要的资料越来越困难,搜索引擎的出现为解决这一难题提供了方便。 
关联规则一直是数据挖掘领域中一个研究热点,被广泛的应用于各个领域。随着web2.0时代的到来,特别是以用户为主导产生互联网内容的社交网络的兴起,数据积累呈现出指数级的增
随着虚拟现实和计算机动画的发展以及游戏领域的需要,树木在风中摆动的模拟已成为研究热点。至今,在树的建模以及树木在微风中的运动方面,已有很多研究。但树木在强风作用下
随着生物学技术的迅猛发展,生物数据正在以几何数量级的速度增长。利用已知的生物网络和多源生物数据找到致病基因,对于了解疾病的发病机制、研发新型药物、制定精准医疗方案
光纤传感技术是伴随着光纤制造技术和光通讯技术的发展而逐步形成的。分布式光纤温度传感系统是专门为大范围多点温度测量的应用而设计的。它可以测量长达数公里的传感光纤沿
学位