基于本体的数据源映射方法与策略

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:wellstudyc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,随着网络技术的发展和各种网络应用的普及,与传统的静态HTML页面相比,蕴含数据更加丰富,质量更高的网络数据库正引起研究人员的广泛关注。然而,在特定的应用领域,由于不同的开发者对同一个数据库模式的理解存在差异,从而导致了在系统、语法、结构和语义层面上,对描述同一个数据库的数据模型存在差异。在这些差异中,由语义理解导致的语义异构将直接影响网络数据集成系统的应用。因此,如何消除语义异构问题成为了网络数据集成领域急待解决的核心问题。为了解决语义异构的问题,本文引入了本体的概念。本体是描述领域知识的有效工具,它为系统提供了一个领域通用的术语和关系集,同时为待匹配的模式提供了领域级的证据和分类方法,因此可以有效地解决网络数据源模式集成系统中的语义异构问题。本文从深层网络中本体与数据源映射的相关技术出发,首先对研究现状及映射工具做了简要的介绍,然后给出了映射的形式化定义。在此基础上,本文重点讨论了本体与数据源映射的构建方法及过程。从对数据源模式的预处理开始,包括领域分类和分类本体的建立以及对数据源模式的标记过程,到最终的映射建立和查询分析,本文都给予了详细的介绍。最后,本文还介绍了三种不同的查询分析方法,并对各种方法都给予了实例验证。通过本文介绍的方法,网络数据集成系统可以很好的解决语义异构问题,并通过不同的应答方式对用户的查询做出响应。
其他文献
音频分割是指根据说话人特征、环境、信道条件,将音频流“自动”切分成若干同质区域的方法。由于其在音频检索、语音识别等应用中具有潜在价值,近年来受到了广泛关注。在各种音
很久以来中医一直依靠指面感觉来体会患者桡动脉搏动处的脉象信息,因此诊断时需借助医师的经验,这样使得其应用和发展都受到了很大的限制。所以,利用现代科技对脉诊进行客观
整个网络中的信息按深度可分成两个层次,表层和深层。表层主要包括“静态网页”,是指以文件形式静态存放在服务器上的数据信息。深层则主要包括“动态网页”,是指隐藏在表单
在很多实际应用中,数据的类别之间存在一种自然的序关系。例如,我们用1~5星去评价一部电影,3星评价高于2星评价,而4星评价低于5星评价。和标称数据不同,我们称这样一类数据为
在多核单机系统上,多个共享资源的线程或进程间的交错执行是不确定的,导致并行软件难以开发、调试,存在安全隐患。为保证线程或进程交错执行的确定性,课题组已提出确定性生产
车牌识别技术在智能交通系统中占有非常重要的地位,车牌识别系统主要包括车牌定位、字符分割和字符识别三大部分。其中,车牌定位和分割的结果对后续的识别起决定性作用,所以
对于领域性的信息检索系统来说,准确率的要求往往是其最为关心的,因为目前通用的信息检索系统对于具有高度领域性的信息来说并不能展现出良好的效果,甚至远远达不到可用的程
随着因特网的发展,网络信息量正突飞猛进地增长,人们越来越依赖搜索引擎来准确地获取所需的信息。搜索引擎在为网民提供便捷的搜索服务的同时,也影响着网站的发展前景,所以搜
生物医学文本挖掘的目的是借助文本挖掘技术帮助生物医学研究者从海量文献中更有效地找到所需信息、发现隐藏的生物医学知识。通过对孟德尔人类遗传在线(Online Mendelian In
近年来,随着手机用户的不断增长,短信已经在人们的日常生活中发展成为一种非常重要的交流方式,同时,由于短信的高效,低成本和无时空限制等优势受到了越来越多企业的重视。然而,目前