Native-XML数据库中数据存储和查询的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:jonasgu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML是一种可扩展标识语言,作为一种结构化的、包含语义的、面向用户的语言,它具有可扩展性、跨平台性等明显特点。这些因素使XML在许多领域得到了广泛的应用,在网络上,XML成为信息发布和交流的基本格式;在分布式系统中,XML成为程序交换数据的基础;在传统领域,XML也得到很好的应用。 现在,XML正在成为信息交换和存储的标准。随着应用范围的不断扩大,XML文档越来越多。在管理和利用XML文档这方面的研究,有力地促进了XML文档存储技术的发展。XML与数据库结合的研究有两种做法:一是XML-enabled的数据库,它以关系数据库为主,在数据库中引入XML的特点,并提供一个转换层将底层的关系数据库包装起来;另一个是Native-XML数据库,它以XML数据模型为基础,自底向上重新构建数据库。 本文针对Native-XML数据库提出了一个XML文档的数据模型ROM(RelatedObiectModel),给出了XML文档各部分的定义和在XML查询所涉及运算的定义,从而将现阶段独立发展的XML查询和XML存储联系在一起,给出一个统一的逻辑视图。并在这个模型的基础上,进行了XML规范化的尝试,给XML文档的设计带来帮助。 在这一模型的基础上,综合底层数据库的实现特点,本文提出一种存储结构。该存储结构的实现主要考虑两个因素:1.XML文档是数据存储和查询的单位,2.提供对于XML文档操作的灵活性。该存储结构可以使用指针表示文档内部元素之间的关系,并将属性和联系分开存放以提供运算上的方便。 本文还根据存储结构的特点,给出了相应的XML查询语言UXQL(UpdatableXMLQueryLanguage),UXQL语言增加了对于目录和文件操作的语句,给出关于元数据操作的语句,提供了更通用的访问文档内容的方法。本文主要工作包括: 1.介绍当前XML各方面发展的现状,阐述了关于XML的各种查询和存储技术。 2.详细分析并讨论XML和数据库的结合,以及所面临的问题。 3.提出一种面向数据库的XML数据模型ROM,其中包括XML文档和各种特性的定义,以及XML查询语言所涉及到的各种运算。 4.给出基于ROM的XML规范化方法,并讨论了这种数据模型与其它数据模型的区别。 5.提出一种基于ROM的XML数据库的物理存储结构,详细讨论了各种特性的实现方法。 6.参照ROM提出对于查询语言的改进,以及在ROM中查询语句的解析。 7.给出一个面向文档的XML应用实例。
其他文献
开放式控制器人机接口(HMI)是开放式数控系统的核心组成部分之一,为操作员提供了便于操作的友好的图形用户界面(GUI).针对NC200数控系统,该文首先介绍了数控系统的总体结构,
随着网络的发展,网络管理越来越重要.各大院校的校园网都已经初具规模,良好的网络管理成为校园网能否正常、有效运行的关键.性能管理的最大作用是能帮助网络管理者减少网络中
当今社会中,随着人们远程协同工作需求的日益增长以及计算机技术、网络通信技术的进一步发展,计算机支持的协同工作(CSCW)逐渐成为人们研究的焦点.协同编辑系统作为CSCW系统
该文针对传统数据挖掘技术在图像挖掘上的不足,分析了当前图像挖掘的特点及现状,并在全面、深入掌握数据挖掘技术的基础上,结合数据库及数据仓库,图像检索和处理以及人工智能
信息化时代的到来,各种数据规模飞速增长。面对规模越来越大的网络、图数据规模,如何高效的对其进行处理,成为一个新的挑战。本论文主要对图处理中的关键技术:图存储与并行计
属性约简是粗糙集理论研究的核心问题之一,该文首先介绍了Pawlak粗糙集模型以及决策表、差别矩阵和约简等基本概念,并在此基础上详细介绍了属性约简的几种基本算法,如PQ算法
AAA,即Authentication,Authorization和Accounting,是一种旨在核实用户身份,提供用户服务权限,收集用户消耗资源信息的分布式网络资源访问控制体系结构.它是认证计费依据的理
随着网络技术和网络应用的不断发展,网络安全变得越来越重要,对网络系统进行安全性测评是保证网络安全的有利手段,已成为研究热点.该文在深入研究网络安全测评的标准、模型和
本文论述基于J2EE体系结构建立网上试题库系统。建立网上试题库系统的目的是通过网络共享试题资源,并提供网上考试功能。J2EE是建立服务器方应用程序的一种系统平台。基于J2EE
该文提出了安全分级思想,据此对NETFILTER进行体系扩展,以实现将各种典型的防护手段无缝地连接到一个统一的框架中.这样做的好处是用户可以根据自身的需要选择相应的安全级别