一种基于XML的元数据模型设计方法的研究

来源 :电脑知识与技术·学术交流 | 被引量 : 0次 | 上传用户:xwy_pk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:元数据在网络信息资源的管理、存储和检索中发挥着重大的作用。目前业界对于元数据的定义和管理都还没有统一的标准。在现有元数据标准的基础上进行扩展,并提出一种基于XML的元数据模型的设计方法,在元数据的层次上来定义和管理资源。
  关键字:元数据;XML;XML Schema;元数据模型
  中图分类号:TP30文献标识码:A 文章编号:1009-3044(2008)06-10ppp-0c
  A Research About The Method Of Metadata Model Design Based On XML
  XU Xiao-jing,YANG Qing
  (Computer Science And Technology Academy,Wuhan University Of Technology,Wuhan 430063,China)
  Abstract:Metadata takes an important action on the manage、save and search of network information resources. Today, there has no uniform standard about the definition and management of metadata. Based on the exist standard of metadata and extend it, bring out a design method about the metadata model based on XML, definite and manage resources on the metadata levels.
  Key words:metadata; xml; xml schema; metadata model
  
  1 引言
  
  计算机网络的发展,使数据形式出现了多样化,除了数据库以外,还有许许多多的数据存放于TXT文件或者其他字处理文件和表格文件或者视频和图像文件,这些数据本身又呈现出各种不同的形式。这样,大量分散的形式以及不同格式的数据给现代数据处理带来越来越大的困难。
  数据库特别是关系数据库具有极强的数据管理能力,数据的安全程度高,具有稳定可靠的并发访问机制。但是各数据库管理系统之间的异构性及其所依赖操作系统的异构性,严重限制了信息共享和数据交换的范围;此外,数据库技术的语义描述能力较差。因此,在数据交换和共享方面,传统的关系数据库面临着严重的挑战。
  元数据是”关于数据的数据”,它极大的方便了异构系统间数据的交换和共享。元数据建模是指为更好利用数据,为所使用数据创建更健壮、生命力更强的数据模型的行为。 一般来说元数据建模包含两个方面工作,信息建模和创建模式。信息建模包括静态信息建模、动态信息建模、文档设计,而创建模式则是利用元语言构建数据模型。元数据模型描述了系统内各个元素、元素之间的关系及元素的属性,为在不同模型中交叉使用公共定义数据提供了多方面的协定。
  XML作为更好实现网络互操作和数据交换的标记语言,已经得到极大发展。XML正在逐渐成为Web上数据组织和交换的标准,也是实现语义Web和Web服务的基础。XML作为一种语言,可以对结构化和半结构数据进行标注,作为一种标准可以建立特定领域的数据的组织和交换规范。因此,目前已经成为不同行业和领域中元数据建模所采用的标记语言。
  异构系统间数据的交换和共享以及不同形式内容的管理,这些都已经成为急需解决的问题。目前,已经有了很多关于内容管理和元数据建模方面的研究,但这些研究大多是针对特定需求的专项研究。为了系统的研究与内容管理相关的处理方案,我们提出一套基于XML的元数据模型的设计方法。本文建立了一个元数据模型的框架,用以说明与元数据处理以及异形内容管理相关的途径。
  
  2 相关概念简介
  
  2.1 元数据模型
  目前一些专家认为元数据模型[4]应当包括两个层次:描述数据自身的元数据和描述数据之间关系的元数据。
  描述数据自身的元数据主要是指那些只与数据本身相关的一些信息,比如数据标识信息、数据生成时间、数据质量信息和数据发布信息等现有的元数据标准。而描述数据之间关系的元数据则描述了各个数据集是通过什么样的关系构成了一个有机的整体,比如最基本的组成关系。
  2.2 其它概念
  元数据模型包括描述数据自身的元数据和描述数据之间关系的元数据。而元数据是关于数据的结构化数据。目前,一般的都使用XML语言来表示元数据,而XML文档的结构或模式需由DTD或XML Schema来描述。
  根据上面分析,得出本文涉及的各概念之间的相互关系,用下例UML图来表示:
  
  图2 元数据模型框架
  
  由图2可知,此框架主要由三部分组成:元数据层、元数据管理层以及元数据处理模块。输入数据流为该框架提供数据源,元数据处理模块在元数据层和元数据管理层之间发挥着“桥梁”的作用,它主要实现元数据的读取、编辑、写入和解析等功能,辅助完成元数据模型的管理。
  元数据主要是从各类数据源中提取而来。不管是TXT文件、字处理文件、表格文件还是各类图象视频文件,都可以按照一定的标准来提取元数据。最初提取出来的元数据是一个个分散、杂乱无章的数据,没有系统性。因此,为了便于元数据的统一管理和使用,这里我们提出了元数据层的概念。元数据层是统一存放元数据的地方,我们可以把它看作是一个元数据的容器。这个容器是元模型的核心,它存储着一系列定义元数据的结构良好的XML文档,它是实现异构系统间数据交换和共享的基础。
  元数据管理层主要完成元数据模型的创建、存储、查询、修改等功能。在本文中,元数据模型即一组“XML Schema”和“XML文档”。由于XML Schema本身也是一个XML文档,所以,只要有支持XML数据类型的容器就可存储元数据模型。如,Oracle 10g数据库就支持XML Type的数据字段,此外,它还提供XQuery来支持对基于XML元素的查询。这样,就可满足元模型的管理和查询。
  该元数据模型框架是以元数据的管理为中心而设计的。框架的主要应用场景是一般的内容管理系统,其中涉及到不同类型的数据源,异构系统之间数据的交换和共享以及需要实现基于语义的查询。
  3.2 元数据的定义
  这里,我们定义元数据遵从的标准是基于国际上公认的都柏林核心元素集[6](DUBLIC CORE,DC)而扩展的。DC元数据格式描述的对象是网络资源。简单的元素定义和设置可以很方便的著录,是DC获得广泛应用的重要原因,然而它也带来另外一个问题,对著录对象的描述深度不够,不能进行专指度较高的检索。因此,本文将采用DC应用模式中的简单DC(Simple DC)模式来定义元数据。
其他文献
“莫道桑榆晚,为霞尚满天”,这是广泛流传的唐代诗人刘禹锡的著名诗句,王藏江先生躬身践行实证了其非常正确。十余年来,从中高级军官变身为著名画家,其间虽经历了辛酸苦辣,但他却已取得了令人瞩目的成就与成功,实在是可喜可贺。经年累月,笔耕不止。一杆玉笔随秉性,满纸华章见真情。王藏江先生在书画艺术的道路上不断开拓奋进,登上一山,又攀一峰。  一位曾经在青藏高原纵横弛骋三十多年的军人,在定居天府之国的蓉城后,
摘要:P4P是为解决目前P2P网络所引发的低效率和网络资源利用问题,而诞生的一种简单、轻量级的网络体系结构。该文主要从P4P的来源、与P2P网络的区别、P4P的架构以及P4P的未来发展趋势几个方面对P4P进行了介绍。  关键词:P4P;P2P;轻量级  中图分类号:TP393文献标识码:A文章编号:1009-3044(2009)22-pppp-0c    近年来,基于P2P[1]的网络应用越来越多
摘要:该文在分析和研究了WCF原理特性的基础上结合作者多年的ERP系统架构与实现经验,提出了一种基于WCF的分布式的信息系统的结构模型(B/S/S与C/S/S模型结构),并基于此模型结构设计了一种多层的分布式软件体系架构,该结构模型与体系架构有着更好的灵活性、安全性、可扩展性,并且该架构模型和体系架构支持多种网络终端设备。  关键词:WCF;结构模型;体系架构;信息系统;B/US/S;C/S/S 
摘要:Ada语言源代码经编译器编译后生成一个后缀名为Ali的文本文件。该Ali文件中包含了丰富的有关Ada源代码的信息。该文剖析了由M1750 Ada编译器编译生成的Ali文件内包含的具体信息内容,并介绍了基于Ali文件的分析并结合Lex词法分析工具来实现ADA语言静态分析器的过程。  关键词:Ali文件;Ada语言;Lex;静态分析器  中图分类号:TP311 文献标识码:A文章编号:1009-
摘要:自人类文明诞生之日起,人文精神就成了伴随人类文明演进的一个永恒话题。外国文学著作中涵盖的人文主义精神值得我们借鉴与思考。本文以美国文学巨匠海明威的小说《老人与海》为例,简要分析其中所折射出的纯朴人文精神以及在面对生存、发展中的阻碍表现出来的不放弃的进取精神。同时主人公对人生目标执着追求的奋斗精神、不畏艰险敢于拼搏的牺牲精神和作者对构筑理想社会的深刻观点也值得我们探讨与借鉴。  关键词:外国文
摘要:在我国大多数高校中,非计算机专业的学生普遍认为计算机教学中的程序语言设计课程非常难学。该文从教学内容、教学手段、教学方法等方面介绍了一些关于课程的改革建议,以利于培养学生学习兴趣和问题分析及解决的能力。   关键词:非计算机;VB;教学手段;教学方法;教学改革  中图分类号:G424 文献标识码:A 文章编号:1009-3044(2009)22-00000-00    目前的社会发展已经进入
摘要:分析非泛型的Java系统存在的数据类型转换安全问题,提出基于Java泛型的解决方案。通过对泛型的原理分析,探讨Java泛型的实际应用。并在此基础上,总结Java泛型的的特点。  关键词:泛型;对象包装;数据类型转换;集合  中图分类号:TP393文献标识码:A文章编号:1009-3044(2008)22-690-03  Research on Java Generics   WU De-pe
王卫新、隋晓荻等著的《英国文学批评史》一书,揭示了英国各个时期文学批评的理念及演变过程。全书共有六章,分别介绍了英国文艺复兴时期的文学批评、18世纪英国的文学批评、英国浪漫主义时期的文學批评、维多利亚时期的文学批评、20世纪上半叶的文学批评、20世纪下半叶的文学批评。从某种程度上说,撰写英国文学批评史的过程就是重新体味英国文化的过程,经历英国社会发展变迁的过程。历史无法复原,任何一部文学批评史都不
摘要:传统GIS数据模型难以适应配电GIS拓扑分析,利用 Geodatabase数据模型中的几何网络来描述配电网拓扑结构,提出了一种全局数据处理方法,对配电网数据进行设备分层、拓扑处理,以此建立配电几何网络,这为配电网络拓扑分析奠定了基础。最后,基于所建配电几何网络,结合东莞大朗镇配电GIS项目,实现配电网络拓扑分析中的供电电源分析,并给出了具体的算法实现。  关键词:地理信息系统;GeoData
摘要:该文在对EOS开发中存在的一些问题进行分析和对Barracuda架构深入研究的基础上,提出了一个基于Barracuda架构的SOA开发模型,以解决传统EOS开发中的效率问题,并对如何实现基于Barracuda架构的SOA开发模型进行了较详细的分析。  关键词:Barracuda;EOS;XMLC;SOA开发模型  中图分类号:TP311文献标识码:A文章编号:1009-3044(2008)3