基于概率Prolog的本体匹配

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：lonwang

【摘要】

：

W.N.Borst在1997年定义本体是共享的概念模型的形式化的规范说明。它用来构建知识库，可以方便知识共享。随着语义网的发展，人们构建了很多本体。例如借助维基百科构建的DBpedia

【作者】

：

王原原

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2016年期

【关键词】

：

本体匹配概率Prolog ProbLog程序马尔科夫逻辑网

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

W.N.Borst在1997年定义本体是共享的概念模型的形式化的规范说明。它用来构建知识库，可以方便知识共享。随着语义网的发展，人们构建了很多本体。例如借助维基百科构建的DBpedia、用在商业上的freebase.com和特定领域的知识库（音乐本体和医学本体）。然而，由于人们在构建本体时通常是针对某一应用的，导致了本体是很不同的，例如使用不同的名称命名实体。构建的不同使得即便是相同领域的本体也有很大的差异（异构），造成共享知识时会有语义上的误解。然而，随着语义网的发展，使得将相同领域的本体连接起来进而实现知识共享的目标越来越重要。解决这一问题的有效方法是本体匹配。　　本体匹配是协调异构本体之间的语义，实现它们之间的互操作。具体而言，本体匹配是找到两个异构本体之间的实体(实例、类和属性）对之间的对应（等价、不相交、相交、包含和包含于）。基本的做法是给定两个输入的本体，和初始的匹配对，通过人工、半自动或者自动的方法找到实体之间的对应关系。虽然本体匹配研究已经10多年了，过去多是用规则的方法和机器学习的方法，很少用规则（逻辑）和概率相结合的方法研究本体匹配。本文在尝试用概率Problog程序自动地做本体匹配，本文的主要的工作有以下:　　1:提出来用概率Prolog程序做本体匹配。概率Prolog程序是概率逻辑程序的一种语言，将概率和逻辑相结合可以表达不确定的复杂关系结构。这和只基于规则、概率的方法的不同之处在于同时考虑了规则和概率。在本体匹配的过程中，通过构建不确定的规则有助于表达匹配对之间的潜在影响关系。另外，通过规则可以克服基于概率的机器学习算法的数据之间的独立同分布的情况。我们将其用于做本体匹配:首先通过相似度度量方法得到两对本体实体对之间的初始相似度，其次通过构建用于表达不同候选匹配对之间的影响的启发式规则，再次将初始相似度和启发式规则转化成概率Prolog程序，进而通过推理和过滤得到最后的匹配对。另外，提出可以将概率Prolog程序转化成贝叶斯网中的Noisy-Or模型，可以加快推理的速度。最后通过在不同数据集上做实验，和与我们方法最接近的马尔科夫逻辑网相比较，得出我们得到我们的方法可以得到较高的召回率;参加OAEI比赛的系统做比较，在阈值为0.7的时候，F值排在第四名。　　2:提出学习概率Prolog的参数。虽然没有直接可以用来学习概率Prolog的方法，但是我们发现概率Prolog可以在多项式时间内转化成标注析取的逻辑程序，从而可以借助学习标注析取的逻辑程序的参数得到概率Prolog的参数。这里我们避免了手工设置参数的主观性。同时我们考虑到马尔科夫逻辑网的参数也可以学习，因此，我们借助于Alchemy系统，学习了马尔科夫逻辑网做本体匹配的参数。除此之外，我们也讨论了在不同的参数对本体匹配结果的影响是不同的。

其他文献

基于FPGA的SOPC嵌入式系统设计技术

本课题的研究以作者所属实验室正在进行的GB18240.7税控商业自动化管理系统为背景，提出并详细介绍了一种基于Altera SOPC技术的嵌入式系统设计方法，并结合网络税控器系统进一步

学位

网络税控器嵌入式技术现场可编程门阵列可编程片上系统μClinux技术掉电保护

楚雄电信移动用户数据仓库构建及用户流失预警分析

随着我国移动用户日趋饱和，市场竞争越加激烈，用户流失状况也更加突出。而电信企业经过多年的系统建设和运维管理，现已累积大量用户数据，通过分析在网用户的消费习惯、所用业务特

学位

数据仓库分类算法决策树电信移动用户

异构架构下OpenCL程序跨平台优化方法研究

计算机体系结构领域已大步迈入异构时代，异构架构已广泛存在于服务器、个人电脑、嵌入式终端等系统中，在越来越多的应用领域大显身手。加速器微结构的多样化，是异构时代的重要特

学位

OpenCL异构架构编译优化跨平台

RFID数据流管理与挖掘若干关键技术研究

无线射频识别(Radio Frequency IDentification，RFID)技术已经得到了越来越多的应用。在这些应用中，RFID阅读器会实时地采集大量包含监控对象时间、位置和状态信息的标签数据，这

学位

无线射频识别数据流管理数据挖掘清洗策略不确定性估计复杂事件处理

一种基于802.1x认证的访客网络准入控制系统的设计与实现

在高速发展的信息时代，网络安全问题已成为影响企业生产力和收入的重要因素之一。大多数企业曾遭受过网络攻击，导致了机密信息的泄露。应对层出不穷的网络安全问题，当前网络准入

学位

访客网络准入控制系统802.1x认证协议软件设计

基于多Agent系统的智能路由资源分配策略

目前的动态路由方法周期性地采样网络参数.由于呼叫到来的随机性和传输与处理的延时,使决策的作出在整个采样间隔内落后于采样时刻,导致它们均只是准实时的,从而影响决策的准

学位

路由选择多Agent系统接通率负荷平衡神经网络仿真实时网络路由

邮政综合网主机系统应用互操作的研究

该文重点讨论邮政综合网主机应用系统互边互操作的应用需求,概要描述了90年代以来企业计算领域应用系统互连互操作技术的主要发展;讨论分布计算与通讯技术的基础理论,给出网

学位

计算机网络操作系统CORBADCOMJavaRMI

微处理器的硅前性能验证方法的研究

微处理器的硅前性能验证是在处理器芯片生产之前的重点工作内容。通过对处理器设计的各项性能指标进行测试分析，发现出存在的性能缺陷并予以改进，从而确保处理器最终实际性能符

学位

性能验证仿真平台硅前性能微处理器

快速多光源渲染算法的研究与实现

全局光照技术是图形学领域的研究热点之一。传统的全局光照算法如路径追踪，辐射度，光子映射等存在计算量大，收敛速度慢等问题。多光源渲染技术将全局光照下的渲染转化为虚拟点光

学位

全局光照文化遗产多光源渲染矩阵分解

中文情感知识库构建与应用

在互联网飞速发展的今天,海量的文本数据在网络上共享传输,文本的自动分析处理成为一个研究热点,而文本中包含情感的获取对于语义的理解有着直接作用,情感知识库在这一工作中

学位

情感计算情感知识库词语情感倾向词语相似度

基于概率Prolog的本体匹配

与本文相关的学术论文