论文部分内容阅读
本文结合科研项目背景中的实际需求,分别针对以上三个步骤中XML的具体应用展开了研究。本文的研究结果可主要归纳为以下几个方面:
1.异构XML数据上完整性约束的挖掘
该部分研究针对异构数据集成的数据准备过程。由于XML逐渐成为数据交换标准,而对于XML数据,需要了解其上的完整性约束,尤其键约束,为后面的数据匹配进行指导。本文针对XML文档上的函数约束,提出了函数约束规则,并给出了可在多项式时间内执行的算法来挖掘这些规则,由这些规则还可以容易的得到XML键。
2.设计和实现了一个可视化的XML数据映射系统
异构数据集成中的一个关键问题是如何描述多数据源中的数据映射关系并自动完成数据映射操作。为了解决实际应用的问题,本文在分析了Biztalk等商业化映射系统的优缺点的基础上,设计和实现了一个多XML文档映射系统TRANSer。该系统可以分为可视化工具和映射引擎(XDME,XMLDataMappingEngine)两个部分,相互关联。其中前者主要针对异构数据集成的数据匹配阶段,后者针对异构数据集成的数据合并阶段。该系统支持多源文档输入,提供可视化设计工具让用户通过拖拉等简单操作设计映射关系,并且能够在映射的同时编辑目标Schema。TRANSer提供各种函数满足实际应用。相对XSLT,该系统采用开放式的映射函数模块设计,用户可以编写自定义的映射函数以实现特殊的数据映射功能。通过映射函数的组合,可以进行复杂数据映射操作。
3.XML在GIS领域的应用研究和实际应用实例
该部分针对特定领域(GIS领域)相关的XML数据集成的模式,阐述了以上技术的实际应用。本文讨论了现阶段XML在GIS领域中数据集成的应用,其后给出了应用实例,并对以上技术的应用予以了具体分析。