基于模式映射的异构数据集成模型研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:fox542
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种企业级系统的快速发展和异构框架的不断丰富,将各种异构系统进行的集成就成为当前数据库领域的一个热点问题。要实现系统集成就首先进行数据集成,而基于本体的数据集成在各种数据集成方法中脱颖而出,成为目前数据集成领域中的重要研究点。一般情况下,由于数据源的异构性和多样性,数据集成中会存在各种各样的冲突,比如常见的命名冲突,单位冲突,顺序冲突等等,所以必须首先发现冲突,然后按照人工的或者自动的冲突消除规则对冲突进行处理。鉴于上述考虑,本文利用本体的语义性,提出了一个基于模式映射的数据集成模型,该模型构建于映射规则(Rule-based),并且能够自动发现和消除特定的冲突(Conflict-solved),所以将其命名为RCM。本文首先对RCM进行建模,该模型包含了局部概念集、全局概念集、映射集、冲突集和约束集,其中后三者是该模型的核心。我们用映射文档的形式来对后三者进行描述,然后在此基础上提出了一个冲突发现和消除的算法,最后阐述了RCM框架的实现。在数据源描述方面,每个局部数据源由它自己的本体来描述语义。但是为了使每个源本体之间能够相互比较,在最上层建了一个共享的词汇集,共享的词汇集包含了领域内基本的术语,即构建了一个代表全局数据源的本体,这样就涵盖了RCM模型中的局部概念集和全局概念集。在此基础上,用OWL自定义的映射文档对局部数据源与全局数据源之间的映射关系进行描述,从而将RCM中的映射集、冲突集和约束集的信息记录到映射文档中。本文研究了基于板映射模型的冲突消除算法和常用的查询重写算法,分析了它们的部分不足之处,提出了适合在RCM上进行冲突发现和消除的算法。在映射文档中自动发现冲突并判断冲突发生的子数据源及对应的属性,并同时在映射文档中进行修改。在查询重写的过程中,将借助该映射文档来消除以单位冲突和格式冲突为代表的数据冲突和以命名冲突为代表的语义冲突,从而保证查询结果的正确性。本文最后介绍了由RCM延伸出来的框架,具体包括用户接口、查询处理、文档处理和结果提取四大部分,结合GLAV、本体等技术的各自优势,提出了各部分可行的实现方式。
其他文献
随着计算机和通信技术的发展,企业信息安全问题受到越来越多的关注。企业除了要抵御来自外界的攻击和破坏,同时还要防止来自内部的有意或无意的泄密。仅依靠完善管理制度很难
随着Internet信息技术的发展,传统的商业环境逐渐摆脱过去缺乏活力、封闭的竞争模式,开始转化为开放、共享、多元化的面向在线服务的新环境,越来越多的用户参与其中,享受网络
无线体域网(Wireless Body Area Network,WBAN)是由许多附着于人体体表或植入人体体内的传感器节点自组网而形成的一个无线传感器网络。它通过传感器节点对人体生理参数的持
本文利用Hilbert-Huang变换及Hilbert谱对绝缘子泄漏电流进行分析,研究了污湿状态下绝缘子的闪络机理。首先针对经验模态分解过程中存在的端点效应问题提出了基于绝缘子泄漏电流特征的解决方案并通过试验验证了该方法的有效性。之后通过改进后的经验模态分解实现了绝缘子泄漏电流的去噪处理,通过与小波去噪的比较显示出了该方法的优势。最后,采用Hilbert边际谱及边际能量谱研究了不同相对空气湿度、盐
生物监测的基本原理是利用水生生物个体、种群的数量、性质、生理及运动行为等特征的变化来指示水体环境质量的变化,表征环境污染状况,从生物学角度为水体环境质量监测和评价提
学位
近年,随着Internet和网络应用的普及以及数字压缩技术的进步,各种流媒体应用如视频点播(Video On Demand), IP电话,视频会议纷纷兴起。然而,由于流媒体应用通常具有单连接占
结对编程(Pair Programming)是极限编程(Extreme Programming,简称XP)的十二个实践之一。结对编程是一个非常直观的概念,简单的说是指两位程序员肩并肩地坐在同一台电脑前合
学位
随着计算机教育的普及和发展,内蒙古大学计算中心计算机数成倍的增长。机器数已达到600台,全部计算机宽带接入因特网,中心日接待学生达到2000人次,为全校学生提供了一个功能完善
当前40Gbit/s传输技术已经进入了“普及应用阶段”的快速健康发展期,而100Gbit/s高速网络相关标准正逐步成熟,预计在未来3-4年内将会得到快速发展。同时近期市场调查报告显示