关系--XML双引擎数据库管理系统CoSQLRX中XML数据索引的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:fanyanbing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要描述了基于关系-XML双引擎数据库管理系统CoSQLRX的XML数据索引的研究与实现。双引擎数据库系统是指能同时处理关系型数据和XML类型数据的数据库系统。随着XML相关技术的发展,XML数据的应用领域越来越广泛,许多领域都存在对关系数据和XML数据统一管理的应用需求,目前国内却缺少有影响力的关系-XML双引擎数据库管理系统,所以CoSQLRX数据库管理系统的实现具有重要的现实意义。CoSQLRX系统在关系型数据库管理系统的基础上,加入纯XML存储和XML查询处理技术,可以完成许多领域中的数据管理工作,例如企业信息化和电子商务等领域。创建XML索引是加速XML查询的重要手段。在CoSQLRX系统中,XML数据索引是一个重要的模块,本文主要阐述了针对此模块的研究与实现。首先,本文介绍了XML数据索引的概念及其研究背景和现状,分析了几种基本的XML索引类型以及相应的特点。然后,本文阐述了XML索引模块的设计。文中介绍了XML数据在CoSQLRX系统中是如何存储的,索引结构的设计,以及索引构建、更新、扫描的流程。在CoSQLRX系统中,XML索引的结构主要包括两部分,即中间信息表(XmlInfoRelation)和B-Link树。建立XML索引的时候,从纯XML存储中读取XML文档中的数据,提取里面的有用信息,如路径信息,值信息等,将其存入中间信息表(XmlInfoRelation)和B-Link树中。执行XML查询处理时,系统会解析查询语句,调用合适的索引,然后在B-Link树中寻找符合查询条件的结点,如果找到则进一步取出该结点在中间信息表中的相应信息,进行进一步分析,最终决定该结点是否作为查询结果返回。基于以上的思想,本文设计并实现了四种XML数据索引:简单路径索引,值索引,祖先/后代索引和Twig索引。最后,本文介绍了XML数据索引是如何实现的,并利用XMark测试基准对XML索引的创建和查询作了一些测试。从测试结果可以看出,在CoSQLRX系统中建立了XML数据索引之后,可以有效的加速XML查询处理。
其他文献
随着移动互联网的蓬勃发展,移动社交网络(Mobile Social Network Service, Mobile SNS)也逐渐流行起来。Scene Life系统就是在这样的背景下出现的。这是一个全新的Mobile SNS
随用户需求的不断提高,网络业务逐渐向多样化方向发展。为适应这种变化,未来网络的主要特征将呈现出融合性、异构性。而目前网络管理系统中的管理信息模型仍然是网络相关的,
在超深亚微米工艺下,长总线时延成为了影响系统整体性能的重要因素。然而,电路中寄生元件作用日益显著,严重的串扰效应,使得总线的实际时延加倍,因此,针对总线的串扰效应开展容错设
传统的交换网络将所有的业务和控制能力集中在交换机上,导致新业务的提供需要较长的周期,且仅提供简单业务无法产生足够的收益,于是,业务需求促使了下一代网络(NGN)的出现。
随着展馆管理的信息化、自动化及安全级别等的不断提高,传统管理方式中使用人工监控及采集数据的方式已越来越无法满足需求。传统的展馆管理方式无法实现对参观者及展馆情况
视频运动目标检测与跟踪技术是随着数字视频技术的发展而产生的一个新的研究课题,在国防安全、民用事业等领域有着广泛应用。粒子滤波算法本身适用于非线性非高斯动态模型,更
CRM (Customer Relationship Management客户管理),是在企业电子商务中流行起来的概念。通过构建CRM系统,企业基于对客户详细资料的深入分析,来提高客户满意度与销售业绩,从
Internet作为一个典型的复杂网络实例,对其宏观拓扑结构的特征分析是目前研究的主要内容和热点问题,受到了学术界的广泛关注。近年来人们在该领域的研究取得了长足的进展,但
云计算是一种全新的IT服务模式,向大量用户透明地提供按需、弹性、高效用的多租户服务。云计算凭借其超大规模存储能力、超大规模分布式并行计算能力、较高的可靠性和可用性
随着全球能源的日益短缺和温室效应的不断加剧,国际社会对节能的要求已经深入到人们生活的各个领域。近年来,由于网络技术不断进步,各类应用需求迅速增长,网络设备的规模和复