基于MLN的中文事件推理方法的研究

来源 :苏州大学 | 被引量 : 3次 | 上传用户:donglu1116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据爆炸性增长的环境下,信息抽取成为一种从海量数据中获取有价值信息的重要手段。事件抽取是信息抽取的一个子任务,其目的是把含有事件信息的无结构化文本以结构化的形式呈现出来,对问答系统、自动文摘和信息检索等自然语言处理应用的发展有着重要作用。现有的事件抽取方法大多将事件实例看作孤立的个体,忽略了事件实例之间的内在联系。本文主要从中文事件触发词推理、中文事件论元推理及中文事件联合推理三个方面进行研究,主要研究内容如下:第一,针对中文中存在的缺省问题,提出了基于马尔科夫逻辑网络(Markov Logic Networks, MLN)的中文事件触发词推理方法,运用篇章一致性原理、形态结构和组合语义学进行触发词推理。在ACE 2005中文语料上的实验表明,在触发词识别和事件类型分类上的F1值比基准系统分别提升了3.65%和2.51%。第二,针对现有的论元抽取方法中单纯利用句子级特征所导致的与触发词距离远的论元抽取性能低下的问题,提出了基于MLN的中文事件论元推理方法,运用篇章一致性原理和实体语义信息进行论元推理。在两个事件主题(冲突主题和司法主题)上实验的结果表明,和基准系统相比,在论元识别和论元角色分配上的F1值分别提高了6.84%和5.71%。第三,针对传统的事件抽取系统中管道模型会造成级联错误这一缺点,本文提出了基于MLN的中文事件联合推理方法,利用篇章级信息,加入了同指一致性和论元数量推理等推理规则,利用论元抽取中有价值的信息反过来帮助触发词抽取,从而恢复了部分触发词。在触发词识别、事件类型分类、论元识别和论元角色分配上的F1值比基准系统分别提升了1.68%、1.63%、1.92%和1.89%。本文提出了基于MLN的中文事件推理方法,实验结果证明了该方法的有效性,有利于该领域和相关领域的进一步研究。
其他文献
本文主要研究的是基于测井数据的地质图矢量化方法。首先要对测井曲线及地质图进行预处理,对于含有不同种类噪声的图像,通常采取不同的方法进行处理,甚至需要使用几种方法的
作为构建“数字城市”系统的重要组成部分,同时作为目标提取和识别的一个典型应用,图像中建筑物目标区域提取越来越受到关注。本文在简单场景图像中建筑物提取技术的研究基础
学位
无线传感器网络(Wireless Sensor Networks,WSNs)是由大量的计算、存储、通信能力有限的传感器节点构成的网络,能感知、采集及检测监测区域中目标的各种信息,并将处理后的信
统计机器翻译是以大规模双语平行语料为基础,充分利用计算机较强的计算能力,通过统计分析,构建翻译模型、语言模型、调序模型,进而利用此模型进行翻译的自动化技术。目前,统
现代远程教学系统是在网络技术、多媒体技术等技术的基础上发展起来的,打破了传统教育中学校的局限,使得在分居各地的互不相识的人可以同时进行学习。远程教学系统为学生提供了
学位
机会网络中的路由算法不再依赖于端到端的连接,主要依靠节点与节点之间的相互协作,通过“存储——携带——处理——转发”的工作模式实现数据传输,更符合实际的需求。机会网
随着Internet的快速发展,网络电话VoIP也得到了推广,由于其较传统电话资费便宜、可视频通话等优点,VoIP在长途电话、越洋电话等方面应用尤其广泛,但与传统电话相比,VoIP话音质量还
移动社交网络,是一种结合了网络与节点社会特性的时延容忍网络。现有的时延容忍网络路由协议假设源节点和目标节点之间至少存在一条完整通信路径,已经无法适用于该新型网络。
随着网络技术的飞速发展和网络应用范围的不断扩大,对网络的各类攻击与破坏与日俱增。在网络安全问题日益突出的今天,如何迅速有效地发现各种入侵行为,对于保证系统和网络资源的
相比于浅层网络,深度网络拥有更为有效的函数表征能力,可以为高度非线性且高度变化的函数学习到一种紧凑的表示。深度学习算法通过预训练和微调解决了深度网络的训练问题,使