基于本体的Web数据集成研究与应用

来源 :贵州大学 | 被引量 : 1次 | 上传用户:zhaoyuanhappy200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和分布式应用的发展和普及,大量的异构数据源应运而生。特别是当前Web技术的飞速发展,人们获取信息的途径大量来自于网络。而Web是一个巨大的信息集散地,又同时也伴随着一个巨大的问题——信息泛滥、混杂。它给Web上信息的有效获取及利用带来一定的困难。如何使用户快速有效的获取和利用Web上的大量信息,这是目前国际上许多机构和组织正在研究的焦点问题,也是Web信息管理的关键技术之一。为此,本文引入本体概念来实现异构Web数据集成,本体的使用有利于解决数据集成中的语义异构问题,这是其它数据集成技术考虑较少的方面。本文在介绍了基本的语义网的原理及相关标准后,重点研究了数据的获取和集成。数据获取的过程分为三个阶段:定义抽取规则,获取网页及清洗页面,格式转换。首先在用户参与下,根据样本页面学习获得抽取规则,之后下载页面并利用Tidy工具清洗,最后由系统完成数据的抽取和转换。文中介绍了基本的基于DOM树的方法,以及改进的基于语义块的方式。数据集成的过程包括:构建领域本体,本体与抽取数据库的映射,查询处理。本体是语义集成的基础,文中阐述了领域本体的构建方式,建模工具,数据库实例的语义标注及查询处理过程。最后对论文工作进行了总结和展望,提出了此方面尚需研究和改进的问题。
其他文献
随着多媒体技术的成熟、网络的发展和信息处理能力的加强,多媒体数据库的发展与完善日益成为一个迫切的需求。由于媒体数据具有数据量大、种类繁多、数据结构和格式多样化的特
数字视频监控以其直观、方便、信息多样,广泛应用于多种场合。嵌入式网络摄像机是视频监控系统的主要组成部分。系统的软硬件平台与其相关应用软件的设计,是嵌入式网络摄像机系
软件度量和估算能够有效的监控软件进度。在常用软件度量方法中,对规模的度量和估算是所有度量活动的基础,其结果可作为其它度量的一个主要输入,因此在软件度量活动中具有重要地
Web服务具有良好的封装性、松散耦合性、高度可集成能力等特点,能够解决工作流程管理中各应用单元分散、需集成的应用软件平台不统一等方面的问题,但Web服务不能很好地解决有关
H.264/AVC是由ITU-T的视频编码专家组(VCEG)及ISO/IEC的活动图像专家组(MPEG)共同研究、适应于低码率传输的新一代视频编码标准。它具有高压缩比、高图像质量和强抗误码性等
云计算通过云服务代理完成与用户之间的交易,在云环境下,一切皆为服务。作为21世纪又一代技术革新产物,云计算充分应用互联网平台,将虚拟化的云资源按照用户需要提供给用户,并在交
语音识别以语音信号为研究对象,是语音信号处理的一个重要研究方向,是模式识别的一个重要分支。随着现代计算机技术的发展,计算机的使用越来越深入到人们的日常生活中。人类
针对下一代Internet网络体系结构要求精简高效的特点,四川省网络通信重点实验室提出了“单物理层用户数据传输与交换平台体系结构(SUPA)”,采用带外信令控制思想将Internet现有
Internet 的流行使得人们信息通讯和协同工作变得容易,而网格可以帮助人们更进一步的共享Internet上汇聚的一切资源,包括计算资源、数据资源、CPU、存储器、数据库、应用软件、
在计算机科学朝着普适、互联、智能、代理和人性化等方向发展的过程中产生了多Agent系统这一全新的领域;事务处理技术是当前有效管理和使用计算机信息资源的关键所在。将事务