基于本体的数据集成技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:CBN_cntjlz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科技的不断发展,计算机成为了人们生活中不可或缺的部分,而近年来在数据资料越来越多的前提下,接涌而至的就是数据的存储问题。因为现有的数据大部分是基于不同平台、使用不同格式、出于不同目的构造的,因此它们具有异构性和分布性的特征,这个特性大大影响了数据的交互和重用。为了解决这一问题,国内外科学家提出了许多对数据进行集成的方法,其中基于“本体”这一概念的方法效果尤为良好,成为现在人们研究的新热点。本论文首先对基于本体的数据集成中所用到的理论基础与相关技术进行了介绍,其中在概述本体理论后,给出了本体数据集成的模型框架,并对框架中各部分所用技术进行详细说明,主要有:XML转化、本体构建、XML与OWL映射和查询处理。在此之后本文将侧重点放在了本体映射这一关键技术上,随着越来越多的相似度算法被提出,本体映射模型也开始多样化,但是经过仔细研究发现,已经成熟的模型和普遍使用的相似度算法依然有许多局限性,通过充分分析现存常用的模型特点后,找到了普遍存在的几个缺点,分别为:计算量偏大、自动化程度较低、移植性困难和算法单一。为了改善这四个常见缺点,本文创新性提出了改进的多策略混合映射模型(O-ESMR),此模型是由特征提取、概念筛选、多策略映射和结果处理这四个关键模块构成,其中主要详述了进行创新的概念筛选模块和多策略映射模块。在概念筛选模块中,通过使用WordNet这个技术,可以计算出组成两概念的词语相关度,再通过词语相关度可以推算出概念相似度,在与设定好的阈值进行比较后,筛选出候选概念集,该模块的目的是改善计算量偏大这个缺点;多策略映射模块不仅通过自动加权的方式改善自动化程度较低的问题,并且通过基于名称、属性、结构、实例多策略混合的方法改善移植性困难和算法单一的问题。最后本文对提出的改进的多策略混合映射模型进行了实验,数据集采用OAEI(Ontology Alignment Evaluation Initiative)所提供的 benchmark 数据集,将本文的映射结果与常用的比较成熟的模型结果进行了比较。在对实验结果进行充分分析和研究后,发现该模型在保证查准率和查全率的基础上,成功减少了计算量,进而降低算法的时间复杂度。
其他文献
目的探讨卡托普利三联小剂量单次给药对老年不同类型高血压的疗效及安全性。方法选择老年高血压患者156例,分为A、B两组,其中A组84例为老年单纯收缩期高血压(ISH),B组72例为
1 机遇与挑战近几年,随着数字电视整体转换的开展,越来越多的有线电视用户转为数宇电视用户,而且随着技术的发展.有线电视网络早已脱离了单一电视信号传输的功能,发展成为可以同时
当前,我国海上方向总体形势比较复杂,"海上丝绸之路"建设的发展和未来,面临海上局部战争呈现出新情况、新特点。加强海上方向战略布局问题研究,为适应我海上军事力量和规模调
<正>近期,2017年普通高考考试大纲的修订与颁布引起了广泛的关注:一是增加了能力的内涵,对能力要求进行了加细说明,首次提出对数学核心素养的考查,增加了数学文化考查的要求;
本文介绍采用多机合一数字硬盘自动制播系统。优化和完善张掖电视台落后低效的半自动制播平台的解决方案。
<正>2014年,爱奇艺率先提出"网络大电影"概念(以下称"网大"),因为成本低、周期短、回流快的特点,网大开始受到众多关注。2015年,随着《道士出山》的爆红,无数资本争先恐后涌
采用曲面柔性轧制方法可以实现三维曲面板类件的连续、柔性成形,为了验证该方法的可行性,本文基于曲面柔性轧制原理,设计出成形装置并研究了装置关键部件工作辊的驱动方式,驱
“英雄”自古就是一个让人仰视的称谓。什么样的人可以称得上英雄?他们又有什么样的共同品质?近日,一项有关英雄的推选活动引起社会的广泛关注:由公安部政治部主办的“我心中的警
报纸
磷酸二氢钾(KH2PO4,简称KDP)晶体,是一种性能非常优良的非线性光学晶体,其生长研究已经有80多年的历史,是一种长盛不衰的多功能水溶性晶体。由于KDP晶体具有较大的非线性光学
1 引言在刚刚结束的2006国际有线电视技术研讨会(ICTC2006)上.思华科技以其鲜明的观点“互动为本,时移为先“赢得了各地广电运营商的青睬,思华科技的时移和互动电视解决方案,成为了