基于本体的异构数据集成研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:edisonckw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的发展和企业信息化正日益加剧,使得企业内部的各种应用系统得到了广泛地应用。但由于其开发时间和开发部门的不同,使得这些数据源往往呈现出异构现象,并且它们彼此独立且相互封闭,致使数据难以在系统之间共享和融合。随着人们对获取完整的、分布的和异构信息的需求的不断加强,促进了数据集成技术的产生。数据集成技术目标是实现各个数据源之间信息的交流和共享,屏蔽各底层数据源的异构性,提供给用户一个统一的视图以完成多数据源的数据操作。本文主要研究的是基于本体的异构数据集成,在总结了现有的集成方式的优缺点的基础之上,提出了基于本体的数据集成架构,并研究了此架构所用到的关键技术。主要工作如下:①分析了当前信息集成中存在的问题,介绍了信息集成的几种典型系统架构,提出了基于本体的信息资源集成框架,并详细描述了框架的各个组成部分的作用。此集成架构具有松耦合、易扩展、支持语义查询等良好特性。②研究了数据集成所用到的关键技术:本体构建、本体映射和查询处理。③本体构建。研究了局部本体构建和全局本体构建。局部本体构建是从数据源中进行语义抽取完成构建。数据源包括结构化数据源(关系数据库)、半结构化数据源(XML文件)和非结构化数据源(WEB网页,文本文件)。全局本体构建需要领域专家的参与。④本体映射。研究了全局本体与局部本体映射,局部本体与数据源本体映射。全局本体与局部本体映射使用基于学习和HowNet多策略映射方法完成。局部本体与数据源映射在局部本体构建的过程中完成。⑤查询处理。提出一种全局查询语言LSQL。查询处理包括全局查询语句解析、查询变量绑定、查询分解和查询重写。查询语句解析产生查询树。查询结果以统一的形式进行整合,显示给用户。在查询处理过程中,本文还提出一种基于类源映射表查询优化机制,提高查询速度,实现了查询优化。⑥最后,给出论文的研究意义和下一步的工作。
其他文献
人体肝脏的数字化模型是数字医学和图像分析领域的研究热点之一,近年来备受研究者的关注。肝脏数字化重建的目的是将医学成像获取到的数字图像通过计算机技术实现可视化,为肝
由于现实世界的数据大多存放在关系数据库中,近年来多关系数据挖掘受到越来越多研究人员的重视,而多关系分类和聚类都是多关系数据挖掘中的重要技术。在进行多关系分类时,由于关
在计算机世界,尤其是图形学的动画制作中,渲染过程是最后一项非常重要的步骤,可以实现人们想要实现的、逼真的视觉效果。随着人们对视觉效果的要求越来越高,基于物理的流体渲
在数据网格环境中一个文件可能有多个副本,这些副本通常数量级大并且是分布存储的,因此当计算结点在远程调用某个文件时需要对该文件的众多副本进行优化选择。本文在深入研究
大容量存储设备和数字化设备的出现和广泛使用,以及多媒体技术和网络技术的迅速普及,导致互联网上的图像数据海量增加。如何迅速、准确地从浩瀚的图像库中检索到所需要的图像
在软件工程中,软件成本估算与需求分析并列,是软件开发成功最重要的两个因素。软件成本估算是将用户需求和软件项目开发联系起来的重要桥梁。软件成本估算是软件成本管理和制定
早期基于文本的视频检索需要耗费大量的人力,而且由于人的因素,对视频的描述信息及其提取的关键词都具有很强的主观性。因此,基于内容的视频检索技术成为了近年来视频检索的
随着当今互联网应用地迅速崛起,广大用户很方便地接收到来自各种应用渠道的大量信息,对信息的需求得到了极大地满足。互联网信息数量激增随之带来的信息过载问题使得互联网信
随着医学图像采集设备(如X光、CT和MRI)的普及,医学图像依然成为了记录和保存病人生理疾病信息的重要载体。一方面,医学图像日复一日的增加,给医生工作者带来了额外的负担,并
根据摩尔定律,传统计算机中的晶体管电路逐渐接近性能极限,再加上电子计算机在计算能力等方面存在的局限性,科学家期待并开始寻找新的计算模型来代替传统的电子计算,其中生物