基于马尔科夫逻辑网的跨语种实体匹配研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:anandebaobei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨语种的实体匹配被定义为找到不同语种内描述同一实体(对象)的实体连接。跨语种的实体匹配不仅扩展了不同语种的知识共享,更是对现今的跨语种信息检索和机器翻译等重要领域有直接贡献,已经成为关系数据的核心研究内容。在实体匹配问题中面临的最大的两个挑战是复杂性处理和不确定性问题,在跨语种的环境下尤为明显。如何能够更好的在统一的模型下同时处理这两个问题,不仅是实体匹配问题,也是整个数据挖掘领域的核心问题之一。Richardson和Domingos在06年首次提出的马尔科夫逻辑网络模型恰好迎合了这一需求。马尔科夫逻辑网络是将一阶谓词逻辑和概率图模型相结合,以获取关系数据的似然模型,是现今学术界普遍公认的一种简单而且较为完美地结合了一阶谓词逻辑和概率图模型的逻辑结构表达方式。它具有重要的研究价值和广阔的应用前景,已成为人工智能、机器学习、数据挖掘等领域的研究热点。本文分析了基于马尔科夫逻辑网络的跨语种实体匹配模型。在原有的一阶谓词逻辑体系中引入了等价谓词,从而形式化表述了语义等价性,使得不同形式的字符序列可表示同一个实体。我们将马尔科夫逻辑网络应用到较为实际的两个应用中,成功解决了跨语种实体匹配中对于跨语言知识依赖性强的问题以及名字翻译中的歧名问题,在一定程度上提高了使用传统方法所得到的精度。
其他文献
该文首先介绍了开关磁阻电动机基本结构和控制原理,重点阐述了开关磁阻电动机直接转矩模糊控制系统模型的基本原理及其组成.其次,该文设计了采用DSP实现的开关磁阻电动机控制
针对传统防火墙中访问规则被滥用而遭到拒绝服务攻击的缺陷,提出并设计了基于访控资源的防火墙ARB-FW.防火墙为网络提供访问控制的安全服务.访问控制的原理及其在防火墙中的
论文首先对ad hoc及网络路由协议进行了综述.介绍了网络路由协议的分类以及ad hoc网络的一些专用路由协议,着重讲解了ad hoc网络中具有相对较优性能的DSR路由协议的机制.同时
“web代理服务器的研究与实现”是信息产业部“电子发展基金”支持的“网络专用服务器”项目下的一个子课题。当前Internet在迅猛发展,但网络带宽的增加与信息量和使用群体的
该文根据国内外已有的研究成果及应用情况,系统地研究了基于角色和任务的安全模型,在此基础上提出了一种授权语言FEAL,并详细讨论了访问控制中任务的影响,为应用程序开发人员
近几年,打车软件日益盛行,行车记录仪的普遍化,为了能快速响应用户的打车需求,也为了能获取行车记录信息协助案件侦破,交通车辆的邻近查询成为解决上述需求的关键。交通车辆的邻近
本文主要研究了如何运用主动网技术解决分布式数据库系统设计过程中涉及到的有关问题。首先详细介绍了分布式数据库系统及主动网络技术的有关概念及其当前发展状况,同时对分布
蓝牙协议的逻辑链路控制和适配层(L2CAP,Logical Link Control and Adaptation Protocol)在蓝牙协议中起着协议复用、分段和重组及提供QoS功能的作用,有着重要的地位.为了给L
目前,一般管理信息系统不具备决策支持功能,而数据仓库在支持决策的同时显得过于庞大复杂,无法适应不同规模的应用.为了解决上述问题,IRS采取以报表处理为中心的设计模式,具
随着量子计算和量子信息技术的发展,分布式量子计算应运而生。通过量子网络将量子计算机连接起来能获得更强的计算能力。分布式量子计算具有逻辑门级并行能力,与传统的并行计