基于本体的Web数据集成研究与应用

来源 :贵州大学 | 被引量 : 1次 | 上传用户：zhaoyuanhappy200

【摘要】

：

随着网络和分布式应用的发展和普及，大量的异构数据源应运而生。特别是当前Web技术的飞速发展，人们获取信息的途径大量来自于网络。而Web是一个巨大的信息集散地，又同时也伴随着

【作者】

：

潘晔

【机构】

：

贵州大学

【出处】

：

贵州大学

【发表日期】

：

2007年01期

【关键词】

：

数据集成数据获取本体映射 OWL 查询处理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络和分布式应用的发展和普及，大量的异构数据源应运而生。特别是当前Web技术的飞速发展，人们获取信息的途径大量来自于网络。而Web是一个巨大的信息集散地，又同时也伴随着一个巨大的问题——信息泛滥、混杂。它给Web上信息的有效获取及利用带来一定的困难。如何使用户快速有效的获取和利用Web上的大量信息，这是目前国际上许多机构和组织正在研究的焦点问题，也是Web信息管理的关键技术之一。为此，本文引入本体概念来实现异构Web数据集成，本体的使用有利于解决数据集成中的语义异构问题，这是其它数据集成技术考虑较少的方面。本文在介绍了基本的语义网的原理及相关标准后，重点研究了数据的获取和集成。数据获取的过程分为三个阶段：定义抽取规则，获取网页及清洗页面，格式转换。首先在用户参与下，根据样本页面学习获得抽取规则，之后下载页面并利用Tidy工具清洗，最后由系统完成数据的抽取和转换。文中介绍了基本的基于DOM树的方法，以及改进的基于语义块的方式。数据集成的过程包括：构建领域本体，本体与抽取数据库的映射，查询处理。本体是语义集成的基础，文中阐述了领域本体的构建方式，建模工具，数据库实例的语义标注及查询处理过程。最后对论文工作进行了总结和展望，提出了此方面尚需研究和改进的问题。

其他文献

多媒体数据库的模型研究

随着多媒体技术的成熟、网络的发展和信息处理能力的加强，多媒体数据库的发展与完善日益成为一个迫切的需求。由于媒体数据具有数据量大、种类繁多、数据结构和格式多样化的特

学位

数据模型描述元素特征匹配多媒体数据关系图

基于平台的嵌入式网络摄像机系统设计和实现

数字视频监控以其直观、方便、信息多样，广泛应用于多种场合。嵌入式网络摄像机是视频监控系统的主要组成部分。系统的软硬件平台与其相关应用软件的设计，是嵌入式网络摄像机系

学位

嵌入式网络摄像机基于平台设计方法视频采集网络通信

基于UML顺序图及类图的功能点度量的研究与实现

软件度量和估算能够有效的监控软件进度。在常用软件度量方法中，对规模的度量和估算是所有度量活动的基础，其结果可作为其它度量的一个主要输入，因此在软件度量活动中具有重要地

学位

功能点度量顺序图类图映射规则

基于网格服务的工作流协同模型研究

Web服务具有良好的封装性、松散耦合性、高度可集成能力等特点，能够解决工作流程管理中各应用单元分散、需集成的应用软件平台不统一等方面的问题，但Web服务不能很好地解决有关

学位

工作流协同网格服务OGSA

H.264/AVC码率控制算法研究

H.264/AVC是由ITU-T的视频编码专家组(VCEG)及ISO/IEC的活动图像专家组(MPEG)共同研究、适应于低码率传输的新一代视频编码标准。它具有高压缩比、高图像质量和强抗误码性等

学位

视频编码H.264/AVC码率控制率失真优化

云环境下基于能耗和SLA的虚拟机资源管理研究

云计算通过云服务代理完成与用户之间的交易，在云环境下，一切皆为服务。作为21世纪又一代技术革新产物，云计算充分应用互联网平台，将虚拟化的云资源按照用户需要提供给用户，并在交

学位

云计算节能SLA演化博弈

基于小词汇量孤立词语音识别系统的研究与设计

语音识别以语音信号为研究对象,是语音信号处理的一个重要研究方向,是模式识别的一个重要分支。随着现代计算机技术的发展,计算机的使用越来越深入到人们的日常生活中。人类

学位

语音识别端点检测特征提取HMM模型

SUPANET中的QoS网络管理技术研究

针对下一代Internet网络体系结构要求精简高效的特点，四川省网络通信重点实验室提出了“单物理层用户数据传输与交换平台体系结构(SUPA)”，采用带外信令控制思想将Internet现有

学位

单物理层用户数据传输与交换平台体系结构网络管理简单网络管理协议基于服务质量的网络管理信息库

基于网格环境的任务调度算法研究

Internet 的流行使得人们信息通讯和协同工作变得容易，而网格可以帮助人们更进一步的共享Internet上汇聚的一切资源，包括计算资源、数据资源、CPU、存储器、数据库、应用软件、

学位

网格计算任务调度遗传算法调度算法计算资源网格仿真系统服务质量

分布式多Agent系统中的事务处理机制研究

在计算机科学朝着普适、互联、智能、代理和人性化等方向发展的过程中产生了多Agent系统这一全新的领域;事务处理技术是当前有效管理和使用计算机信息资源的关键所在。将事务

学位

Agent多Agent系统事务处理APL

基于本体的Web数据集成研究与应用

与本文相关的学术论文