论文部分内容阅读
中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2009)0720050-01
一、XML技术
XML是SGHL(标准通用置标语言)的一个子集,它结合了SGML和HTML
的优点并消除其缺点,使其在Web应用中既能利用SGML的长处,又保留了HTML的简单性。
XML在诞生后的几年中,以一种超越HTML的速度发展,XML的发展已经超出了它的创立者当初设想的程度,已成为网络服务中不可缺少的元素。XML文档的内容与格式分离,易于被机器读取和处理,通过一个XML文档就可以把数据信息的内容、结构和含义完整地表达出来。XML并不限于在Web上的应用,它已经被广泛地用于置标语言设计、数据交换、智能代理、精确搜索、不同数据源集成以及网络出版等。
从本质上来说,XML是描述半结构化数据比较适合的数据模型,作为数据模型它有以下优点:
1.具有自描述性。XML中的语义标识一方面限定了元素的层次结构,另一方面也说明了元素的含义。在XML的搜索结果中,由标识就可以知道内容的含义,这使得搜索结果更有意义。这也是下一代Web的方向语义Web。
2,具有平台无关性。XML文档是纯文本,独立于平台和应用。所以XML可脱离具体应用而自行描述保存在异构环境中的各种数据,其他系统应用能直接对这些自描述的XML文件中的数据进行操作。因此,它将成为跨平台数据交换和操作的标准模式,实现异构数据源集成中数据的互操作性。
3,能描述不同复杂程度的数据。XML提供了数据的结构化表示,并且易于操作。XML可以用一种统一的数据模型描述来自不同数据源的数据,屏蔽数据源中应用环境和数据结构的异构性。
4,具有可扩展性。XML可以在不破坏现有结构和系统的情况下增加新的数据字段。应用服务器利用XML对所有数据建模,若要改变数据模型只需改变数据模型定义,如DTD(或XML Schema)等,不需要重新编码现有对象。
所以,从数据模型的角度来看,XML很适合用来描述各种异构数据源。
二、数据交换
数据交换是实现数据共享的一种技术,通过数据交换,实现各系统间的数据共享、互联互通、业务协同是解决目前“信息孤岛”现象的关键途径。
作为企业之间数据交换系统的中间格式标准,最基本的一条就是通用性。国内还没有与行业相关的成熟的数据交换标准,因此可以把XML文件作为数据交换的标准,即把所有的非XML格式的要用于交换的企业信息转换成XML格式,用它作为中间数据格式,需要交换数据的企业可以通过某种媒介获取XML格式的信息,然后转化成自己能够识别的信息,这样就完成了一次数据交换。
在XML出现之前,由于缺乏合适的数据描述方式,因此无法将各种不同模式的数据表示成统一的数据模型。这样,在进行数据转换时,只能采用图1所示的网状结构,在参与交换的所有种类数据之间相互建立映射关系,对它们进行点对点的直接转换。假设有N个不同的数据源参与交换,那么需要建立N*(N-1)/2个映射关系。
XML的出现带来了第二种选择。XML的半结构化的特点一方面满足了表达关系数据库的结构和各种约束的需要,另一方面使之能表达和描述纯文本、二进制数据等非结构化数据。因此,XML完全可以作为异构数据转换的公共数据模型。使用XML文件作为数据转换的公共模型和中间文件而建立的如图2的星型转换结构,在N个不同的数据源参与交换的情况下,只需在各数据源与XML中间文件之间建立N个映射关系。相比网状模型,数据转换的复杂度被大大降低了。
三、海洋数据交换
在海洋数据交换领域中,没有标准的部落式交换的代价是高昂的,相同的数据分析处理模块在很多应用中被重复的撰写,由于没有中间标准,各个系统的代码重用不能得以有效进行,昂贵的数据交换代价是的数据源只能散乱孤立的存在,不能真正做到资源的共享。为了提高信息的时效性和数据挖掘系统,需要制定一系列标准和技术规范来统一各种技术流程和系统中以数字形式存在的各种信息,以达到信息交互共享、查询方便、资料齐全的目的。
自1998年2月,W3C(World Wide Web Consortium)推出可扩展标记语言XML(eXtensible Markup Language)以来,国际上一些海洋强国及研究机构逐渐意识到XML技术在处理多种格式的海洋数据、简化数据交换方面存在着巨大潜力。近几年澳大利亚、加拿大、美国、俄罗斯等国家的海洋领域都在把XML运用到数据交换、资料处理和存储以及日常管理等方面,国际海洋资料交换委员会(IODE)已组成专门研究小组(SGXML)开展海洋XML的技术交流与协调工作。目前,澳大利亚国家海洋数据中心(AODC)根据XML结构化的树型存储结构以及深层次的嵌套表达特点,将站点观测海洋数据的站位信息、质控细节、海洋具体观测数据记录等封装起来形成一个XML文档。
由于XML具有能描述比常用的关系型数据结构更为复杂、更接近现实的数据的能力,同时XML可以粒状地更新,因此XML在海洋观测信息采集、预处理、质量控制、海洋元数据提取以及数据的存储和维护等方面改变传统的数据构造和处理方式。用XML制定的海洋信息交换标准将给不同海洋信息系统之间数据交换带来方便,从而推动海洋信息化的发展。
参考文献:
[1]夏登文、石绥详、姜岩、于戈、王国仁,XML海洋信息应用分析,海洋通报,2005年,第24卷,第1期,84-86页.
[2]国家标准委员会,信息技术-数据元的规范与标准化(GB/T18391-2002),北京:中国标准出版社,2002.[3]The MarineXML Project.http://ioc.
unesco.org/iode/contents.php?id=33.
作者简介:
秦艳(1978-),女,山东日照人,硕士,山东水利职业学院助教,主要从事计算机教学和研究方面的工作。
一、XML技术
XML是SGHL(标准通用置标语言)的一个子集,它结合了SGML和HTML
的优点并消除其缺点,使其在Web应用中既能利用SGML的长处,又保留了HTML的简单性。
XML在诞生后的几年中,以一种超越HTML的速度发展,XML的发展已经超出了它的创立者当初设想的程度,已成为网络服务中不可缺少的元素。XML文档的内容与格式分离,易于被机器读取和处理,通过一个XML文档就可以把数据信息的内容、结构和含义完整地表达出来。XML并不限于在Web上的应用,它已经被广泛地用于置标语言设计、数据交换、智能代理、精确搜索、不同数据源集成以及网络出版等。
从本质上来说,XML是描述半结构化数据比较适合的数据模型,作为数据模型它有以下优点:
1.具有自描述性。XML中的语义标识一方面限定了元素的层次结构,另一方面也说明了元素的含义。在XML的搜索结果中,由标识就可以知道内容的含义,这使得搜索结果更有意义。这也是下一代Web的方向语义Web。
2,具有平台无关性。XML文档是纯文本,独立于平台和应用。所以XML可脱离具体应用而自行描述保存在异构环境中的各种数据,其他系统应用能直接对这些自描述的XML文件中的数据进行操作。因此,它将成为跨平台数据交换和操作的标准模式,实现异构数据源集成中数据的互操作性。
3,能描述不同复杂程度的数据。XML提供了数据的结构化表示,并且易于操作。XML可以用一种统一的数据模型描述来自不同数据源的数据,屏蔽数据源中应用环境和数据结构的异构性。
4,具有可扩展性。XML可以在不破坏现有结构和系统的情况下增加新的数据字段。应用服务器利用XML对所有数据建模,若要改变数据模型只需改变数据模型定义,如DTD(或XML Schema)等,不需要重新编码现有对象。
所以,从数据模型的角度来看,XML很适合用来描述各种异构数据源。
二、数据交换
数据交换是实现数据共享的一种技术,通过数据交换,实现各系统间的数据共享、互联互通、业务协同是解决目前“信息孤岛”现象的关键途径。
作为企业之间数据交换系统的中间格式标准,最基本的一条就是通用性。国内还没有与行业相关的成熟的数据交换标准,因此可以把XML文件作为数据交换的标准,即把所有的非XML格式的要用于交换的企业信息转换成XML格式,用它作为中间数据格式,需要交换数据的企业可以通过某种媒介获取XML格式的信息,然后转化成自己能够识别的信息,这样就完成了一次数据交换。
在XML出现之前,由于缺乏合适的数据描述方式,因此无法将各种不同模式的数据表示成统一的数据模型。这样,在进行数据转换时,只能采用图1所示的网状结构,在参与交换的所有种类数据之间相互建立映射关系,对它们进行点对点的直接转换。假设有N个不同的数据源参与交换,那么需要建立N*(N-1)/2个映射关系。
XML的出现带来了第二种选择。XML的半结构化的特点一方面满足了表达关系数据库的结构和各种约束的需要,另一方面使之能表达和描述纯文本、二进制数据等非结构化数据。因此,XML完全可以作为异构数据转换的公共数据模型。使用XML文件作为数据转换的公共模型和中间文件而建立的如图2的星型转换结构,在N个不同的数据源参与交换的情况下,只需在各数据源与XML中间文件之间建立N个映射关系。相比网状模型,数据转换的复杂度被大大降低了。
三、海洋数据交换
在海洋数据交换领域中,没有标准的部落式交换的代价是高昂的,相同的数据分析处理模块在很多应用中被重复的撰写,由于没有中间标准,各个系统的代码重用不能得以有效进行,昂贵的数据交换代价是的数据源只能散乱孤立的存在,不能真正做到资源的共享。为了提高信息的时效性和数据挖掘系统,需要制定一系列标准和技术规范来统一各种技术流程和系统中以数字形式存在的各种信息,以达到信息交互共享、查询方便、资料齐全的目的。
自1998年2月,W3C(World Wide Web Consortium)推出可扩展标记语言XML(eXtensible Markup Language)以来,国际上一些海洋强国及研究机构逐渐意识到XML技术在处理多种格式的海洋数据、简化数据交换方面存在着巨大潜力。近几年澳大利亚、加拿大、美国、俄罗斯等国家的海洋领域都在把XML运用到数据交换、资料处理和存储以及日常管理等方面,国际海洋资料交换委员会(IODE)已组成专门研究小组(SGXML)开展海洋XML的技术交流与协调工作。目前,澳大利亚国家海洋数据中心(AODC)根据XML结构化的树型存储结构以及深层次的嵌套表达特点,将站点观测海洋数据的站位信息、质控细节、海洋具体观测数据记录等封装起来形成一个XML文档。
由于XML具有能描述比常用的关系型数据结构更为复杂、更接近现实的数据的能力,同时XML可以粒状地更新,因此XML在海洋观测信息采集、预处理、质量控制、海洋元数据提取以及数据的存储和维护等方面改变传统的数据构造和处理方式。用XML制定的海洋信息交换标准将给不同海洋信息系统之间数据交换带来方便,从而推动海洋信息化的发展。
参考文献:
[1]夏登文、石绥详、姜岩、于戈、王国仁,XML海洋信息应用分析,海洋通报,2005年,第24卷,第1期,84-86页.
[2]国家标准委员会,信息技术-数据元的规范与标准化(GB/T18391-2002),北京:中国标准出版社,2002.[3]The MarineXML Project.http://ioc.
unesco.org/iode/contents.php?id=33.
作者简介:
秦艳(1978-),女,山东日照人,硕士,山东水利职业学院助教,主要从事计算机教学和研究方面的工作。