基于知识库的企业异构数据集成

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:weiweilee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几十年来,随着科学技术的迅猛发展和信息化的推进,人类社会所积累的数据量已经超过了过去5000年的总和,数据的采集、存储、处理和传播的数量也与日俱增。企业为了实现数据共享,减少资料收集、数据采集等重复劳动和相应费用,必须首先进行数据集成。企业异构数据集成技术是将企业分布的、异构的独立信息源中的有用数据集成在一起,使得用户能够以透明的方式访问这些数据源,以供信息检索、分析处理等应用的技术。现有的集成技术主要分为逻辑集成和物理集成两种方式,对于企业中的信息,因为强调从积累的数据中分析挖掘出有商业价值的信息,更适合用物理集成的方式。物理集成过程中最重要的技术是ETL(抽取、转换和装载)技术。当前已有的一些ETL产品主要基于图形化的作业配置形式,嵌入可执行的脚本,缺少灵活的“记忆”、“推荐”等智能支持。本文从本体和规则引擎入手,研究了一套基于知识库的智能的集成方案。论文提出了一种基于知识库的数据集成框架。此框架将数据集成与知识库、规则引擎等智能技术联系起来,突出了“知识”在集成过程中的作用。论文首先给出了基于知识库的集成框架结构,分析了框架的各组成部分和其作用。接着重点研究了知识库的设计,包括语义库、映射库和规则库。提出了一种基于规则库以及历史映射信息的新的模式映射算法,以求实现模式映射的自动化。分析了规则库和规则管理的相关技术,并给出了在数据集成框架中规则引擎、规则管理等规则相关问题的解决方案。最后论文按照设计的集成框架实现了个人信息集成系统,融入了其中的所有研究点,并实现了数据查询和可视化分析功能,取得了良好效果。与已有的数据集成工具相比,论文提出的集成框架的优势在于:引入了知识库,不断积累的知识为集成的智能化提供了基础;语义库消除了集成过程中的难以解决的语义冲突问题;模式映射的半自动化功能节省了时间和人力;提供了灵活的规则配置功能;提供了可视化分析功能。
其他文献
相对于胡塞尔的认识论思想,他的实践哲学很少受到国内学者关注。本文主要立足于胡塞尔现已出版的伦理学著作和大量的伦理学手稿,尝试以意志为核心,全面展现他的实践哲学的思
健康是人类生存和发展的基础,是评价一个国家经济发展和社会进步的重要标志。公平和公正是健康领域的重要目标,然而,从全球来看,国家之间和国家内部,无论目前总体健康水平的
目的总结双极人工股骨头置换治疗高龄股骨粗隆间骨折的临床疗效。方法采用双极人工股骨头置换治疗75岁以上股骨粗隆间骨折58例,其中,EvansⅡ型3例,Ⅲ型29例,Ⅳ型22例,Ⅴ型4例
<正>"试唱练耳"是音乐考生所应该掌握的基础课程。下面笔者首先将会讲解"试唱练耳"的重要性,随后将会说明在进行"试唱练耳"教学的过程中应该把握的几点,最后说明在实际的教学
中国文学发展到晚明时期,小说创作异军突起。产生了被后世称为“奇书”的《三国志通俗演义》、《忠义水浒传》、《西游记》、《金瓶梅词话》这四部鸿篇巨制。明代四大奇书自
本研究基于中国在2017年雅思A类考试成绩TOP40的国家和地区中排名的不佳表现,评述了同是亚洲国家成绩却居于前列的马来西亚的英语教育演变及教育现状,提出要提高我国英语教学
本文运用法学、经济学和政策科学等学科的基本原理,采用法学分析、系统论、敏感因素分析法和问卷调查等方法,对我国湿地保护进行了政策研究。文章分析了湿地的生态、经济和社会
目的讨论术前营养风险筛查对胃癌和结直肠癌患者术后并发症的预测作用,以及对围手术期营养支持的指导作用,为临床合理开展营养支持治疗提供依据。方法回顾性研究2015年1月-20
创新是发展的动力,尤其在当今金融海啸的背景下,创新及利用创新成果进行创业更是拉动经济增长,扩大就业,改善民生,促进社会和谐的重要手段。国内对于创新与创业的研究也进入
在新冠疫情期间,计算机断层扫描技术(CT)被广泛应用于病情诊断,以尽快对病患进行有效治疗,挽救更多生命。在这些先进设备中,也有蒂森克虏伯的参与——我们提供高质量的轴承部