面向语义的信息集成系统关键问题研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:ZWH815117176
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在围绕信息集成系统的研究中,各自治数据源的异构性可以被划分为:平台异构、操作系统异构、数据模型异构、模式异构和由此带来的语义异构等几个不同的层次。其中,语义异构是这些异构问题中相对较难解决的一类异构,而且语义异构的存在也影响着信息集成系统信息共享的程度。信息集成系统中语义冲突的解决是屏蔽语义异构、实现语义互操作的基础。 不论采用C/S还是B/S结构,目前的信息系统中仍有相当部分的后台数据是以结构化的方式存储的,因此异构数据库集成时其语义冲突的解决是信息集成研究的一类重点问题。由于语义冲突广泛存在于信息集成过程的不同层次,因此信息集成系统从实例集成、模式集成、概念集成到查询处理的各个阶段,都需要对语义冲突问题进行处理。 本文对信息集成过程的不同阶段会遇到的语义冲突问题,进行了分析和探讨,并围绕面向语义的信息集成系统这一概念,对实例集成中数据的语义转换、支持时态语义的本体模型、面向语义的查询系统、以及查询连接优化等问题展开研究。 在简要介绍了信息集成技术的研究现状后,首先对信息集成的3种典型方法做了分析和比较,介绍了基于SQL重现法的异构数据库复制技术的混合式信息集成系统架构,在此基础上提出了基于异构数据库复制的面向语义的混合式信息集成系统架构(Semantic-Oriented based on Heterogeneous Database Replication Infrastructure for Hybrid Information Integration System,简称SOHDR)。其次针对该架构,本文详细阐述了该架构中用于实现增量数据实时集中的自动语义转换层。接下来针对概念集成时刻必然会遇到的概念间的时态语义差异,提出了有时态本体模型及其存储管理。然后针对这种混合式架构在查询处理过程中会遇到的语义问题,给出了该架构下面向语义的查询处理方案,并且进行了查询连接优化的探讨。最后对研究工作进行了总结和展望。 论文在以下方面作了有益的探索和创新性工作。 (1)对信息集成系统中不同层次的语义冲突进行了分析,阐述了全阶段语义异构问题的存在,给出了面向语义的信息集成系统概念,提出了一种基于异构数据库复制的面向语义的混合式信息集成系统架构(下称SOHDR)。SOHDR是后续研究内容的基础。 (2)针对SOHDR,本文阐述了增量数据集中时用于解决语义冲突的自动语义转换层的必要性,并给出了基于规则的自动语义转换方法AuSTR,详细阐述了AuSTR方法中的元数据集和语义转换规则集两个基础数据结构、基于逻辑主键与全字段匹配的实体辨识算法Location和触发器自动生成器。最后详细阐述了自动语义转换层对各类语义冲突的解决策略。AuSTR方法在工程项目中的成功应用,证明了该方法的有效性。 (3)本文提出了有时态本体模型和双时态本体模型。通过给本体模型增加有效时间和版本时间维度的信息,能够提高信息集成系统中全局概念模型对时态语义差异的表达能力。基于时间区间的13种相互关系,分别推导了对有时态本体求取指定时间点的本体快照和指定时间区间内本体片段的定理。此外,本文实现了有时态本体管理原型系统。原型系统上的实验证明了上述2个定理的正确性,反映了在本体中保存时态信息的必要性和原型系统管理有时态本体的有效性。 (4)针对SOHDR在查询过程中将会遇到的语义冲突,本文给出了适用于该架构的查询方案。此查询方案不但能解决查询过程中实例级的语义冲突,而且对个性化语义查询进行了专门的探讨。基于本体这一有利的知识表示工具,定义了偏好本体用于表达用户或角色所拥有的知识背景,该偏好本体可以视为全局本体的一种投影。实验表明,本文实现的基于偏好本体的个性化语义查询系统能够支持个性化查询。 (5)针对信息集成系统中必然存在数据冗余特点,本文提出了一种基于遗传算法的有副本查询连接优化算法。将副本的选择与传统的传输性能、服务器计算能力等因素一起反映到了遗传法的算子设计和适应度计算方式中。仿真实验证明了该算法的必要性和有效性。 本文的研究对信息集成中不同阶段的全方位的语义冲突处理问题有着重要的意义。除了对结构化信息集成的贡献,本文的研究对web信息的集成也有着积极的意义。这是因为当前大量的web信息系统其后台仍旧使用结构化的数据存储和管理方式,即前台web页面的数据内容虽然以文本方式或者半结构化方式展示,但是很多情况下这些内容数据本身是以结构化方式存储于后台数据库的。
其他文献
近年来我国的电力工业发展很快,但是电力消费市场发展速度更是惊人,“缺电”已是2003年大幅度拉闸限电以来的热门话题。高等学校集教学、科研和生活于一体,现已成为重要的用电大
随着智能移动机器人技术的不断发展,对移动机器人能够自主完成任务的要求越来越高。环境地图是移动机器人自主完成任务的首要条件,未知环境中移动机器人同时定位和地图创建对于
随着现代电子信息技术和我国汽车制造业的强劲增长,汽车已不再是简单的交通工具,而是成为现代科技的载体。汽车的快速增长虽然使我们的出门更加便利,但同时也带来了诸多社会问题
随着我国经济的高速发展和城市化建设进程的加快,城市交通日益拥堵,环境污染日益严重。公交优先是解决城市交通拥挤的重要手段,是公共交通系统的一个重要组成部分,它充分体现了“
设备状态故障诊断技术近年来在国内外获得了很大的发展,在保证设备安全、稳定、长周期优质运行方面发挥了很大的作用。随着科学技术的进步与发展,机械设备逐渐趋向于大型化、
铝电解槽作为电解铝工业中最重要的生产设备,也是一个能耗特别高的设备。它运行的是否稳定高效,直接关系到铝的正常生产、经济指标和其使用寿命。如今,电解铝行业正致力于使
计算机断层摄影技术(Computer Tomography,简称CT)广泛应用于医学、工业等领域,如何由测得的二维CT切片图像快速准确地恢复被测物体的三维立体信息,成为了人们关注的焦点,从
伴随着DCS在工业过程控制系统的广泛应用,监控组态软件作为DCS软件系统的重要组成部分得到了飞速发展,已经成为现代计算机控制系统的核心。然而,当前组态软件构建的人机监控
在部队的日常飞行及战备训练中,机场塔台指挥室及时、准确地得到各战斗飞机的相关飞行数据对于任务的完成起着极其重要的作用。由于机堡位置相对分散,需要指派专人到各机堡拷贝
油液监测是监测航空发动机健康状况的重要方法之一。多数航空发动机故障是由零部件异常磨损造成的,异常磨损产生的磨粒较大,由此为实现故障诊断及预警可以对滑油中的大磨粒进