XML在异构数据交换中的研究

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:shuimolanting
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文对基于XML技术的数据交换方式进行了研究,探讨了异构系统间的数据交换问题,提出一种基于XML技术的异构系统数据交换技术,构建了以XML为数据交换标准的异构数据交换平台。
  关键词:异构数据;XML;数据交换
  中图分类号:TP311.12文献标识码:A文章编号:1007-9599 (2010) 10-0000-01
  XML Research on Exchange of Heterogeneous Data
  Sun Cuigai
  (Henan Agricultural University,Huaye College,Shangqiu476006,China)
  Abstract:This article study data exchange technology based on XML,discussed the exchange of data between heterogeneous systems problem,proposed a heterogeneous system data exchange technology based on XML technology,created the heterogeneous data exchange platform by XML data exchange standards.
  Keywords:Heterogeneous data;XML;Data exchange
  一、引言
  目前,许多分布式系统所采用的网络环境、操作系统和数据库系统都有所差异,各个异构系统间的数据共享和交换都比较困难,形成了众多信息孤岛。随着各个系统之间需要交换的数据日益繁重,异构系统间的数据交换技术的研究显得越来越重要。
  二、数据交换平台概述
  数据交换平台的核心功能是方便有效的实现异构系统间的数据访问、集成和交换。
  本文研究的数据交换平台使数据在传输之前都转换成格式统一的XML格式,方便数据在Web上的传输,应用程序在接收到XML数据以后可以方便的对数据做进一步处理。由于系统采用基于开放数据标准的传输方式,这样就增加了系统的扩展性,可以使异构信息系统间非常方便有效的进行数据交换。
  三、 数据转换的研究
  (一)Web数据到XML文档的映射
  HTML定义了一套标准的置标用于标注文档,不允许用户在HTML文档中创建和使用自己的置标,而XML一种置标语言,允许用户在XML文档中根据需要定义自己的置标及属性,使数据具有结构性。HTML中的置标所起的作用仅仅是用于置标文本,置标本身没有意义,而XML主要用来存储和发送数据信息,其语法规则非常严格,所有的XML元素必须都有开始置标和闭合置标。对于一个格式良好的HTML文档来说,可以很容易的转换为XML文档,只需要在HTML文档的首行加上XML声明,消除格式差异,同时将文件的扩展名从.html改为.xml就可以了。
  (二)XML文档和数据库的映射
  在XML和数据库之间转换数据时,需要考虑许多问题,XML不支持任何有实际意义的数据模型,所有XML文档中的数据都会被当成纯文本处理。通常数据转换中间件需要把XML文档中的纯文本转换成数据库的数据类型,或把数据库的数据类型转换为纯文本的XML格式。在XML文档结构和数据库模式结构之间进行相互映射,一般有两种映射方法:模板驱动映射与模型驱动映射。
  四、数据交换的实现过程
  对于一般HTML文档到XML文档的转换关键就是消除HTML文档中不严格的语法格式,首先就要验证HTML文档的格式,这就要使用数据结构中的二叉树的对称性。为了实现HTML文档的置标元素的二叉树结构表示,需要定义一个字符串数组用来存放HTML文档中的置标元素,定义变量S用来存放当前读到的结束置标,用带头节点的线性链表L作为存储结构,其具体转换过程的算法如下:
  (1)首先读取HTML文件,每读入一个开始置标时就把它的置标内容作为一个元素加入到线性表L中。
  (2)当读入一个结束置标时,把它的置标内容写入变量S中。
  (3)将变量S与线性链表L当前尾节点元素比较,如果相同则,以B为根的二叉树的左右子树对称,表示这是一对符合XML的严格语法的匹配置标,并将线性链表L中的此元素删除,不需做其它处理。
  (4)如果变量S与线性链表L当前尾节点元素不相同,则需要依次把P与A的父节点和祖先节点比较,如果找到B与之匹配,此时以C为根节点的二叉树的左右子树就不对称了,则需要增加相应的结束置标和元素A配成一对,然后就可以删除A。这样以C为根的二叉树的左右子树保持对称了,接着可以则在L中删除节点B。如此递推,直到L中只剩下头节点元素。
  (5)在读完HTML文档后,如果L中还剩下头节点元素,则在这个元素内容的前面加上“”,使之成为一对符合XML的严格语法的匹配置标,然后写入HTML文档,即表示转换成功。
  实现XML和数据库之间的交换可以利用Velocity模板,其结合了基于模板驱动映射和基于模型驱动映射技术。
  具体的实现步骤是:
  (1)当业务系统应用程序需要使用底层数据库的数据时,不考虑数据在哪个异构系统中,只要根据输入的查询条件,都会得到所需要的数据信息的一个结果集。
  (2)将查询到的结果集,也就是一个JAVA对象,传给Velocity模版引擎,Velocity将按规定的模版格式,把数据库中的数据按规定的XML格式生成自动生成XML文档。
  (3)当需要将业务系统的信息数据存入底层数据库时,首先将数据转换成XML文档,利用Velocity模版引擎,可以将Schema模式转换成关系表的结构。
  (4)这样利用Schema文档产生了一个表结构。
  (5)最后利用DOM遍历XML文件,将其节点根据表的结构依次存入数据库中。
  五、结论
  本文根据XML的技术特点,对异构数据交换方法进行了研究分析,提出了一种基于XML技术的异构系统数据交换技术。本文所提出的异构系统数据交换技术是一种比较高效的开发技术,具有一定的理论和现实意义。
  参考文献:
  [1]孔祥疆,马玉鹏,李英凡.异构数据库中的数据类型转换[J].计算机应用研究,2006,4:217-219
  [2]Fangju Wang,Jing Li.A space efficient XML DOM Parser.Data&Khowledge Engineering[J],2007,60:185-207
其他文献
摘要:本文以山东省威海市为例,对当前新《劳动合同法》实施现状、农民工对新《劳动合同法》的了解情况及依法维权现状等进行了调查、思考与分析,揭示出在当前我国新《劳动合同法》的实施过程中政府、企业、工人进步的一面,也提出了法制建设所面临的经济与法律的脱节、法律宣传欠缺力度,普法徒具形式等方面的困境,并对促进农民工法律意识的提高提出了自己的看法与建议,认为应深入务实不懈地普法以及新《劳动合同法》应在企业与
期刊
摘 要: 教育部《工程教育专业认证标准》中明确要求(专业必须具有)“明确的、可衡量、公开的人才培养目标。根据经济建设和社会发展的需要、自身条件和发展潜力,确定在一定时期内培养人才的层次、类型和人才的主要服务面向。”以“软件工程”课程为例,基于CDIO-OBE理念,结合专业的培养需求和特点,构建一套课程目标达成度计算方法,以获得对该课程培养达成情况的有效评价结果。  关键词: CDIO-OBE; 软
期刊
摘要:对于计算机数据库SQL语句的优化问题,有的的优化专家认为,通过将性能相对低下的SQL语句优化使其转化为目的相同的性能优异的SQL语句,可以得到近40%的系统性能的提升,一直以来,这是计算机研究者热衷的问题。对人工智能自动SQL优化而言,通常指的是通过使用人工智能技术,自动的对SQL语句进行重新输入,从而将数据库中SQL语句优化为最优的等效SQL语句。  关键词:SQL语句;优化;智能;自动;
期刊
摘要:本文通过分析课程本身特点,利用激发学习兴趣、充分利用多媒体等教学手段、注重加强实训环节的教学等教学手段和技巧来提高教学质量。这对培养学生解决实际问题的能力、提高教学效果有着重要的现实意义。  关键词:学习动机;学习热情;实践能力  中图分类号:TP37 文献标识码:A文章编号:1007-9599 (2010) 05-0000-02  Explore Teaching Skills,Impro
期刊
摘要:本文通过实例讲解利用ORACLE的BBED工具对损坏的Block进行恢复,以供遇到类似问题的ORACLE数据库管理员借鉴参考。  关键词:ORACLE;Block;BBED;恢复  中图分类号:TP309.3 文献标识码:A 文章编号:1007-9599 (2011) 21-0000-01  Oracle Database Block Corruption Recovery  ——An
期刊
摘要:本文从计算机网络的含义和发展历程着手,分析了武警部队网络信息安全存在的主要危险,并针对这些威胁提出了几点对策。旨在与同行共同切磋探讨。  关键词:计算机网络;威胁;对策;武警部队  中图分类号:TP393.08 文献标识码:A 文章编号:1007-9599 (2011) 21-0000-01  Discussion on Computer Network Security  ——The
期刊
摘要:本研究经由资料搜集的整合、分析、探究Flash软件本身的特质后发现,Flash的功能性确实是适合在设计网页领域表现出可期待的动态效果,由于其影像表现可在网络媒体的空间中运用,展现出不同的设计型态,未来更为广泛被运用的趋势将使网络多媒体成为信息传达和人际沟通的好方法。  关键词:AdobeFlash;动态图像;网页设计;网络多媒体  中图分类号:TP391 文献标识码:A 文章编号:10
期刊
摘要:当今社会,各种计算机技术与其边缘科学发展迅速,这对于学校内计算机专业教学是一个严峻的考验,是迎难而上还是停滞于与应付,而相对于国内不断涌现的各类计算机培训机构,其优势已经超越学校教育,从教学模式到教学内容,从教学评估到教师自身的提高,我们可以由此借鉴他人优点,不断完善、提高学校教学水平。  关键词:职业培训;校内教育;计算机教育  中图分类号:G642 文献标识码:A 文章编号:1007
期刊
摘要:本文结合我国目前管理信息系统网络体系建设面临的问题,通过分析传统的基于C/S、B/S的管理信息系统模式,阐述了构建现代管理信息系统的背景和必要性,并在此基础之上,提出了一种基于C/S、B/S混合结构的管理信息系统网络体系的运行模式。  关键词:C/S;B/S;HTTP;管理信息系统  中图分类号:TP311.52 文献标识码:A 文章编号:1007-9599 (2011) 21-000
期刊
摘要:随着人类时代的迅猛发展,计算机已经作为一门学科在社会得到广泛的应用,被人们所接受,计算机教学也受到社会的重视,本文主要从计算机思维和计算机教学中怎样培养思维能力的方法及其意义进行如下的叙述。  关键词:计算机教学;计算机思维;能力培养方法  中图分类号:G715 文献标识码:A 文章编号:1007-9599 (2011) 21-0000-01  Thinking in Practice
期刊