论文部分内容阅读
【摘要】由于XML具备可扩展性、结构性和可验证性等特点,XML已成为新一代网络语言。XML在数据库方面的应用也成为学术界和工业界一个重要的研究方向。本文首先对XML定义和特点进行讲述,然后就XML在数据库方面的应用做了详细的探讨。
【关键词】XML;数据库;数据模型
【中图分类号】TP392 【文献标识码】A 【文章编号】1672-5158(2012)11-0097-01
1、引言
可扩展标记语言(Extensible Markup Language,XML)是适应网络的发展而应运而生的,由于它具备了可扩展性、结构性和可验证性等优点。如今,它已成为互联网上数据表示、交换的事实标准和新一代网络语言。网络上越来越多的结构化数据或半结构化的数据都采用XML格式来进行存储和交换,促使了XML运用在不断的普及。XML数据库是一种新型的数据库技术,它适合对半结构化数据的处理,不仅能很好表示和移植各种类型数据,而且还具有强大的异构数据和数据库系统集成能力。
2、XML的优势
2.1 便于异构数据交换与传输
随着网络技术和Web技术的飞速发展和广泛的应用,网络上存在着大量的异构数据,这些数据具有不同的地理位置、不同类型和不同操作系统平台等。使得各种数据的交换之间是不能直接进行,需要通过某种中介平台进行转换,XML具备了可扩展性和平台无关性等良好的性能,满足了不同类型数据的传输的需要。
2.2 XML具备良好的可扩展性
如上文所述,XML具备良好的可扩展性,这种扩民性正好满足了当前数据交换和传输的需要。XML的可扩展性表现在多方面:(1)xML它集成了HTML易用性与SGML丰富的功能的特点,是以一种自描述、开放式的方式定义数据结构;(2)它不像HTML那样有固定词汇的限制;(3)XML这种交换格式与其它的格式相比,具有更强的易变性和灵活性。XML本身没有与任何的程序设计语言和与任何的软件进行捆绑,具备平台无关性。它的这些特点是非常适合当前不同平台和不同类型数据库的数据进行无缝的交互操作。
2.3 XML具有开放性
XML由W3c组织于1998#2月发布的一种标准,是SGML的一个简化子集,它集成了HTML易用性与SGML丰富的功能的特点。XML在建立之初就定位在Unicode码之上和支持对多语种的处理,它是以一种自描述、开放式的方式定义数据结构,这使得它具有全球的开放性和通用性。
3、XML与数据库
传统的数据库是以关系型为主导的数据应用技术,经历了五十多年的发展,不管是在数据库理论上,还是在数据库应用方面都很成熟。关系数据库具有安全性高和稳定的特点。随着网络技术和Web技术的飞速发展,网络上出现许多的异构和半结构化的数据。
其实XML本身不是一个数据库,只能说它是个文档而已。一个XML文档要包含三个基本要素,分别为:文档类型定义(Document TypeDefinition,简称DTD)、可扩展样式语言(Extensible StylesheetLanguage,简称XSL)和可扩展链接语言(Extensible Link Language,简称XLL)。由于XML文档的DTD的存在,XML文档具备可扩展性、结构性和可验证性等特点,使得XML文档具备了类似于数据库的一些特点。
3.1 XML数据库数据模型
当前XML数据模型主要可以用两种数据模型来非形式化描述;(1)XML标签有向图模型,即XML文档可表示为一个带标签的有向图G=(V,E,R,∑),OEM模型、XPath数据模型等为其中最具典型的代表;(2)是xML标签有向树模型,即xML文档可用一棵带标签的有向树T=(V,E,R,∑)来表示。其中,V为图G或树T中结点的集合,E为图G或树T中边的集合,R是图G或树T的根节点,而∑为所有结点所带标签的集合。
3.2 XML数据库的类型
XML数据库是近些年发展起来一种新型数据库技术。目前,XML数据库有三种类型:
(1)使能数据库(XML Enabled Database,简称XEDB),这种数据库的底层仍然是关系数据库,它是在原来的数据库的基础上增加了XCXML数据的扩充,使它能适应XML数据存储和查询的要求。该类型的XML数据库要通过数据映射层的转换,在转换的过程中,有可能使原始的XML源数据丢失。
(2)原生数据库(Native XML Database,简称NXD),这种类型数据库是通过自然的方式来处理XML原始数据,它是以XML文档作为基本的逻辑存储单位,是专门用来为XML的数据存储和查询设计的一个数据模型和处理方法。
(3)混合XML数据库(Hybrid XML Database,简称HXD),这种是结合了上述两种数据库类型的特点,根据应用的需求,采用混合的设计思想。
3.3 XML数据库处理工具
在XML数据库中,提供的数据处理工具,主要有:DOM、SAX、JDOM等。这些工具中,主要提供为XML文档的编辑、管理和与其它语言编程接口。其中,DOM(文档对象模型)是由W3c制定的一套标准接口规范,通过这个接口可以对数据进行访问、修改、添加和删除等数据操作。
4、XML数据库的建立与数据操作
4.1 XML数据库的建立
传统的关系型数据库是以高层数据为对象形式建立的数据库,在其底层数据由关系型数据库组。与关系型数据库不同的事,XML数据库是将关系型数据库映射到数据集根结点的子结点上,通过根结点上各子树的内容来构造数据对象,这种形式存储的数据就没必要进行数据分析。
4.2 XML与数据库之间的数据操作
在不同类型的数据库或异构数据库之间要进行数据访问或操作,不同类型的数据要进行相应的转换,转换过程规则一般为:先将RDMS转换成XML,然后将XML数据又转换成RDMS数据。根据这个转换的规则,我们可以看到,在转换过程中XML是其一中间转换平台的作用,具体表现为不同数据库或数据进行传递和显示。其转换的过程中,有存在两种转换的顺序:从XML模式到关系模式的转换和从关系模式到XML模式的转换。
5、结束语
XML它的出现,方便了人们访问、查询和共享网络上的不同类型异构数据。XMLiE以惊人的速度被广泛运用到各个领域及各个领域的行业中。而且XML技术正逐渐与其它各种技术相结合,诞生了许多新的研究方向。它是伴随网络发展应运而生,具有很多适合网络数据交换和传输的优点。
由于XML技术推出的时间还较短,很多的XML数据库理论还不完善,它的应用没有得到充分的挖掘。但随着Web技术和网络技术的发展,我们相信XML技术会不断的完善和发展,它与数据库问的结合和应用也会更加的紧密和有效。
【关键词】XML;数据库;数据模型
【中图分类号】TP392 【文献标识码】A 【文章编号】1672-5158(2012)11-0097-01
1、引言
可扩展标记语言(Extensible Markup Language,XML)是适应网络的发展而应运而生的,由于它具备了可扩展性、结构性和可验证性等优点。如今,它已成为互联网上数据表示、交换的事实标准和新一代网络语言。网络上越来越多的结构化数据或半结构化的数据都采用XML格式来进行存储和交换,促使了XML运用在不断的普及。XML数据库是一种新型的数据库技术,它适合对半结构化数据的处理,不仅能很好表示和移植各种类型数据,而且还具有强大的异构数据和数据库系统集成能力。
2、XML的优势
2.1 便于异构数据交换与传输
随着网络技术和Web技术的飞速发展和广泛的应用,网络上存在着大量的异构数据,这些数据具有不同的地理位置、不同类型和不同操作系统平台等。使得各种数据的交换之间是不能直接进行,需要通过某种中介平台进行转换,XML具备了可扩展性和平台无关性等良好的性能,满足了不同类型数据的传输的需要。
2.2 XML具备良好的可扩展性
如上文所述,XML具备良好的可扩展性,这种扩民性正好满足了当前数据交换和传输的需要。XML的可扩展性表现在多方面:(1)xML它集成了HTML易用性与SGML丰富的功能的特点,是以一种自描述、开放式的方式定义数据结构;(2)它不像HTML那样有固定词汇的限制;(3)XML这种交换格式与其它的格式相比,具有更强的易变性和灵活性。XML本身没有与任何的程序设计语言和与任何的软件进行捆绑,具备平台无关性。它的这些特点是非常适合当前不同平台和不同类型数据库的数据进行无缝的交互操作。
2.3 XML具有开放性
XML由W3c组织于1998#2月发布的一种标准,是SGML的一个简化子集,它集成了HTML易用性与SGML丰富的功能的特点。XML在建立之初就定位在Unicode码之上和支持对多语种的处理,它是以一种自描述、开放式的方式定义数据结构,这使得它具有全球的开放性和通用性。
3、XML与数据库
传统的数据库是以关系型为主导的数据应用技术,经历了五十多年的发展,不管是在数据库理论上,还是在数据库应用方面都很成熟。关系数据库具有安全性高和稳定的特点。随着网络技术和Web技术的飞速发展,网络上出现许多的异构和半结构化的数据。
其实XML本身不是一个数据库,只能说它是个文档而已。一个XML文档要包含三个基本要素,分别为:文档类型定义(Document TypeDefinition,简称DTD)、可扩展样式语言(Extensible StylesheetLanguage,简称XSL)和可扩展链接语言(Extensible Link Language,简称XLL)。由于XML文档的DTD的存在,XML文档具备可扩展性、结构性和可验证性等特点,使得XML文档具备了类似于数据库的一些特点。
3.1 XML数据库数据模型
当前XML数据模型主要可以用两种数据模型来非形式化描述;(1)XML标签有向图模型,即XML文档可表示为一个带标签的有向图G=(V,E,R,∑),OEM模型、XPath数据模型等为其中最具典型的代表;(2)是xML标签有向树模型,即xML文档可用一棵带标签的有向树T=(V,E,R,∑)来表示。其中,V为图G或树T中结点的集合,E为图G或树T中边的集合,R是图G或树T的根节点,而∑为所有结点所带标签的集合。
3.2 XML数据库的类型
XML数据库是近些年发展起来一种新型数据库技术。目前,XML数据库有三种类型:
(1)使能数据库(XML Enabled Database,简称XEDB),这种数据库的底层仍然是关系数据库,它是在原来的数据库的基础上增加了XCXML数据的扩充,使它能适应XML数据存储和查询的要求。该类型的XML数据库要通过数据映射层的转换,在转换的过程中,有可能使原始的XML源数据丢失。
(2)原生数据库(Native XML Database,简称NXD),这种类型数据库是通过自然的方式来处理XML原始数据,它是以XML文档作为基本的逻辑存储单位,是专门用来为XML的数据存储和查询设计的一个数据模型和处理方法。
(3)混合XML数据库(Hybrid XML Database,简称HXD),这种是结合了上述两种数据库类型的特点,根据应用的需求,采用混合的设计思想。
3.3 XML数据库处理工具
在XML数据库中,提供的数据处理工具,主要有:DOM、SAX、JDOM等。这些工具中,主要提供为XML文档的编辑、管理和与其它语言编程接口。其中,DOM(文档对象模型)是由W3c制定的一套标准接口规范,通过这个接口可以对数据进行访问、修改、添加和删除等数据操作。
4、XML数据库的建立与数据操作
4.1 XML数据库的建立
传统的关系型数据库是以高层数据为对象形式建立的数据库,在其底层数据由关系型数据库组。与关系型数据库不同的事,XML数据库是将关系型数据库映射到数据集根结点的子结点上,通过根结点上各子树的内容来构造数据对象,这种形式存储的数据就没必要进行数据分析。
4.2 XML与数据库之间的数据操作
在不同类型的数据库或异构数据库之间要进行数据访问或操作,不同类型的数据要进行相应的转换,转换过程规则一般为:先将RDMS转换成XML,然后将XML数据又转换成RDMS数据。根据这个转换的规则,我们可以看到,在转换过程中XML是其一中间转换平台的作用,具体表现为不同数据库或数据进行传递和显示。其转换的过程中,有存在两种转换的顺序:从XML模式到关系模式的转换和从关系模式到XML模式的转换。
5、结束语
XML它的出现,方便了人们访问、查询和共享网络上的不同类型异构数据。XMLiE以惊人的速度被广泛运用到各个领域及各个领域的行业中。而且XML技术正逐渐与其它各种技术相结合,诞生了许多新的研究方向。它是伴随网络发展应运而生,具有很多适合网络数据交换和传输的优点。
由于XML技术推出的时间还较短,很多的XML数据库理论还不完善,它的应用没有得到充分的挖掘。但随着Web技术和网络技术的发展,我们相信XML技术会不断的完善和发展,它与数据库问的结合和应用也会更加的紧密和有效。