论文部分内容阅读
一个设计良好的XML模式是XML应用的前提,因此XML的设计和规范化研究至关重要。目前没有专门针对XML的建模工具,借用面向对象的建模工具UML或关系数据库的建模工具E-R模型设计XML时,UML或E-R模型转换为XML的结果有时不能充分表达语义甚至改变语义、转换方法的差异会产生不同的XML等;XML软件重用设计只是针对某一方面的理论研究,实用性不强;和关系数据库类似,函数依赖是XML树状结构存在数据冗余的主要原因,而对函数依赖和XML范式等XML的规范化研究比较分散。因此本文对XML的设计和规范化两方面进行研究,主要工作如下:(1)研究了UML和XML的建模机制,给出了UML为XML Schema建模的可行性分析和UML为XML建模的方法;结合XML半结构树状结构和UML的特点,提出了按功能模块顺序编写XML Schema的方法,并给出了对XML Schema进行优化处理的方法。(2)研究了用关系数据库中最为流行的建模工具E-R模型为XML建模的方法,给出了由E-R模型构建DTD的方法;但由于E-R模型与XML的结构存在很大的差异,直接构建DTD有一定的困难,于是提出了ERA树和把E-R模型转换为ERA树的算法;针对E-R模型建模易出现两种连接陷阱的问题,给出了消除这两种连接陷阱的方法。(3)软件重用是程序员追求的目标,归纳了在XML中的数据重用、词汇表重用、XSLT标准库重用和组件重用的四种重用方式,以及在XML组件重用中的三种封装策略;提出了DTD中利用参数实体来实现重用扩展;提出了用于设计可重用扩展的XMLSchema的重用扩展模板。(4)XML规范化的研究主要致力于消除由于缺乏语义限制和约束表达能力而导致的数据冗余、不一致和操作异常等问题。总结了当前的XML规范化理论的一些研究成果,特别是在函数依赖、XML范式和XML规范化规则等方面。给出了消除数据冗余的方法和用于解决由部分函数依赖和传递函数依赖引起的数据冗余问题的规范化规则。(5)提出了几点关于XML设计目标和要求的建议,开发XML系统时可以做为参考。用文中的方法实现了网络通用题库系统项目中的试题集,由XMLSpy2007自动生成的内容模型视图和最初按需求设计的试卷结构图几乎完全一致,即用文中的方法能达到设计要求。文中的设计方法是针对一般的XML的设计,也可以用来设计其他XML系统。本课题来源于陕西省自然科学基金项目(2006F50)和航空科学基金项目(06ZC31001)。