篇章级事件可信度计算方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:eagleqizha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言中,事件是一个基本的语义单位,是构成文档的基本要素。事件可信度描述了该事件是确定、否定或者是不确定等情况,表达了人们对该事件内容的态度或看法,即语言文本中事件的真实程度。事件可信度识别是问答系统、篇章理解等诸多相关任务的重要基础。目前,事件可信度识别研究大多仍停留在句子层面,几乎没有篇章级事件可信度的相关研究。因此,本文主要针对篇章级事件可信度语料库建设和识别方法展开深入研究,主要研究内容包括以下三个方面:(1)篇章级事件可信度语料库建设针对目前大部分相关研究仅停留在句子层面的问题,本文构建了一个篇章级事件可信度语料库 DLEF(Document-Level Event Factuality Corpus),促进了相关研究的发展。语料来自“中国日报网”和“新浪双语新闻”等网站选取的4650篇中文文章和1730篇英文文章。首先,在网站上获取相应文章,进行分词等预处理;然后,对每篇文章选取其中的一个核心事件进行标注,标注内容包括句子级和篇章级事件可信度等;最后,对标注完成的语料进行统计分析。(2)基于门控卷积网络的篇章级事件可信度识别方法目前,篇章级事件可信度识别的相关研究较少。本文提出了一个基于门控卷积网络的篇章级事件可信度识别方法 DEFI(Document-level Event Factuality Identification)。该方法首先使用门控卷积网络(Gated Convolution Neural Network,GCNN)从句子和句法路径中抽取篇章中事件的语义和句法信息,然后通过自注意力(Self-Attention)层获取每个序列相对于自身更重要的整体信息的特征表示,从而识别出篇章级事件可信度。在中英文语料上的实验显示,DEFI在宏平均F1值和微平均F1值上的性能表现均优于基准系统。(3)基于BERT的事件句和篇章级事件可信度联合识别方法目前,现有的篇章级事件可信度识别研究建立在事件和事件句已知的条件下,缺乏实用性。针对这个问题,本文把篇章级事件可信度识别问题转换为机器阅读问题:首先通过阅读文章对其讨论事件的可信度问题进行提问;再根据可信度问句来找出事件句和判断篇章级事件可信度。既省去了寻找事件句的工作量,又保留了所有句子对篇章级事件可信度的影响力;最后,采取多任务学习来进行事件句识别和篇章级事件可信度识别。在中文语料上的实验显示,和基准系统相比本文方法在宏平均F1值和微平均F1值上均得到了提高。本文针对篇章级事件可信度识别问题,提出了有效的解决方法,取得了良好的性能,为篇章级事件可信度识别进一步研究提供了借鉴。
其他文献
对于现实世界的各种复杂系统,如果忽略系统中个体的形状、位置等信息,只考虑个体和个体间的联系,就能够将它们抽象为复杂网络。一般地,复杂网络的拓扑统计结构可以用数学中的
图像情感分析就是利用计算机和相关算法,计算出图像中包含的情感语义。目前,基于深度神经网络(DNN)的图像情感分析已成为情感计算领域的研究热点。本文利用卷积神经网络(CNN)
[实验目的]1.检测骨皮质切开术是否能加速正畸过程中的牙齿移动速率。2.检测骨皮质切开术是否诱导破骨细胞生成和骨重建。[实验对象]自北京大学口腔医院动物室采购的75只健康
近年来,有机农业作为一种新兴的实践方式开始被全世界的农民所认识。与常规农业相比,有机农业具有许多独具特色的优点。首先,它可以解决常规农业发展所带来的环境污染和能源消耗问题,其次有助于提高农民收入,发展农村经济,潜力巨大。最后,大众普遍关注的食品安全问题也可以通过有机农业的发展来解决。因此,有机农业在全世界100多个国家得到了推广,在欧美等发达国家有机农业市场广阔。而我国国内目前还未完全实现农业现代
目的:通过分析肘管综合征(Cubital Tunnel Syndrome,CuTS)患者尺神经常规高频超声及声辐射力脉冲成像(AcousticRadiation Force Impulse Imaging,ARFI)的声像图特征,探讨ARFI
双向关系是类脑协同学习中一个重要问题,根据人类个体之间的社交和感知产生的各种社会行为,都需要双向关系的支撑。多方面的沟通,会产生大量的用户行为信息,在双向关系中,用
国家公园是俄罗斯最重要的自然保护区之一。国家公园包括自然综合体和自然景物,具有独特的生态、历史、文化价值,以及重要的民族意义。首先,本文给出了俄罗斯生态旅游发展现
随着人们生活水平的不断提升,人们对生活品质和生活环境质量的要求越来越高,在优美而良好的环境中生活可以使人们获得愉悦安宁并激发人的创造潜能,因此良好的景观环境已经成为人的自然需求和现代人居环境的重要指标。近年来,关于景观环境纠纷的问题层出不穷,然而我国还未建立关于景观权的保护制度,使得人们对景观权利的主张陷入无法救济的困境中。基于此,本文通过对景观权私法保护的可行性进行剖析并以此探寻景观权救济的途径
目的本试验以“健脾滋肾息风”法为指导,自拟方剂“三因复眩方”治疗老年病人因后循环缺血引起的眩晕病。通过观察指标、收集数据等方法来评价“三因复眩方”治疗老年人后循环缺血性眩晕病的临床效果。方法收集符合纳入标准的受试者共64例,并按照随机、对照的试验设计原则进行分组(其中试验组32例,对照组32例)。两组受试者均进行后循环缺血的西医常规治疗,在此基础上,对照组采用甲磺酸倍他司汀片(敏使朗)进行干预,试
随着牙槽骨的持续缓慢吸收1,全口义齿经常出现固位不足、稳定性差、黏膜压痛、咀嚼功能降低等问题2’3,严重影响患者的身心健康。全口义齿通常使用五年左右需要重衬4’5,重衬