异构数据集成中XML若干技术研究与应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:lonwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文结合科研项目背景中的实际需求,分别针对以上三个步骤中XML的具体应用展开了研究。本文的研究结果可主要归纳为以下几个方面:   1.异构XML数据上完整性约束的挖掘   该部分研究针对异构数据集成的数据准备过程。由于XML逐渐成为数据交换标准,而对于XML数据,需要了解其上的完整性约束,尤其键约束,为后面的数据匹配进行指导。本文针对XML文档上的函数约束,提出了函数约束规则,并给出了可在多项式时间内执行的算法来挖掘这些规则,由这些规则还可以容易的得到XML键。   2.设计和实现了一个可视化的XML数据映射系统   异构数据集成中的一个关键问题是如何描述多数据源中的数据映射关系并自动完成数据映射操作。为了解决实际应用的问题,本文在分析了Biztalk等商业化映射系统的优缺点的基础上,设计和实现了一个多XML文档映射系统TRANSer。该系统可以分为可视化工具和映射引擎(XDME,XMLDataMappingEngine)两个部分,相互关联。其中前者主要针对异构数据集成的数据匹配阶段,后者针对异构数据集成的数据合并阶段。该系统支持多源文档输入,提供可视化设计工具让用户通过拖拉等简单操作设计映射关系,并且能够在映射的同时编辑目标Schema。TRANSer提供各种函数满足实际应用。相对XSLT,该系统采用开放式的映射函数模块设计,用户可以编写自定义的映射函数以实现特殊的数据映射功能。通过映射函数的组合,可以进行复杂数据映射操作。   3.XML在GIS领域的应用研究和实际应用实例   该部分针对特定领域(GIS领域)相关的XML数据集成的模式,阐述了以上技术的实际应用。本文讨论了现阶段XML在GIS领域中数据集成的应用,其后给出了应用实例,并对以上技术的应用予以了具体分析。
其他文献
本文对基于G.723.1压缩编码算法的纸介质声音存储系统进行了研究。文章对二维条码技术作了阐述,在对已有的码图结构和编码规则进行分析与研究的基础上,提出了针对本系统的应用
基于进程演算的程序语言设计与实现能够将并发理论的语法和语义理论研究真正应用于实践,并从根本上用高效的并发计算去替代传统的顺序计算,这是研究进程演算的一个关键问题。本
针对现有挖掘算法存在的多趟扫描数据、动态维护复杂、更新效率低等问题,提出了一种基于前缀树的频繁模式挖掘算法PT-Mine 和更新算法UPT-Mine 。PT-Mine 算法利用前缀树压
  电子商务中最重要的活动就是网上交易,但目前的电子商务主要提供了信息的发布、简单的电子货币的使用和固定价格商品销售和购买功能,远远未体现出与传统交易方式相比的优势
集群计算技术近年来成为计算机界研究的一个热点。集群不但能够充分利用现有的计算资源,而且能够通过较低的软、硬件代价实现较高性能的计算机系统。随着微处理器技术和高性
随着计算机和数字媒体技术的飞速发展,越来越多的视觉艺术作品以数字化方式进行创作、保存和传播,成为人们这个时代不可缺少的精神财富。然而,传统视觉艺术作品的审美评估只
本文首先介绍了数据仓库技术的基本概念和特点,然后简单介绍数据仓库的体系结构和数据组织。接着介绍了设计和实现数据仓库ETL(抽取/转换/装载)处理过程。文章讨论了数据抽取
作为集群技术在关键性事务处理领域应用的结果,高可用性(HA)集群是系统可用性与成本之间的一个平衡.在对计算机系统高可用性的关键技术进行分析的基础上,深入研究了高可用性
传统计算模式中的服务选择方法只是根据功能对服务进行选择,并没有考虑服务的上下文关系以及影响功能的其它因素,使服务的选择具有盲目性,导致系统性能的下降.该文对普适计算
本文的主要工作是在讨论模式识别理论方法的基础上,对其在一些多维信号领域的应用进行了分析和测试。本文在总结当前一些应用算法的基础上,根据每个领域自身的特点,设计了一