面向突发事件的因果关系识别

来源 :安徽理工大学 | 被引量 : 2次 | 上传用户:long840223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息网络的高速发展为共享平台带来了每日数以亿万计的事件和话题内容,事件作为信息的一个重要表述类型,面向事件的研究得到越来越多人的重视,事件之间是存在着本质的内在联系的,这种内在联系体现了事件间存在的多种深层语义关系,而其中最为重要的关系即为事件因果关系。事件因果关系识别,有望为面向事件的知识表示、信息检索和自动问答系统等自然语言处理领域的相关应用提供技术支持,对突发事件文本的语义理解具有重要的研究意义。目前,有关识别事件因果关系的方法多集中于模式匹配和统计的机器学习方法。基于模式匹配的方法针对有显示关联词的显示因果关系识别效果较好,但对应于隐式因果关系的识别效果较差,该方法通用性不强。而基于统计的机器学习方法需要预先标注训练语料库,并且对特征具有一定的依赖性,通常识别效果随着语料规模增大而越好。针对上述问题,本文将提出一种基于LSP方法的事件因果关系识别,该方法在单一的事件对匹配基础上增加了句法模式匹配来增强因果事件对的识别效果,减少了对文本语料规模的依赖。主要内容和创新点包括:(1)基于最大熵模型的事件同指消解事件因果关系识别过程中,相同的事件触发词有可能由于没有指向同一实体,而被误判在因果事件对中,这时候往往需要对相同的触发词进行同指事件的判别,来帮助提升事件抽取过程中的性能。针对突发事件新闻文档密度高,同类别新闻语言风格相似的特点,提出基于最大熵模型的事件同指消解方法。该方法首先将人工标注的同指事件对象作为同指消解的正例和反例,分别训练正、反例的权重值,并根据事件的特点对事件要素进行分析,对文档提取语义、距离、关键词等方面的特征;然后,利用不同的特征组合循环迭代,训练最大熵模型;最后利用此模型对测试语料中待消解事件对进行计算来完成事件同指消解。(2)基于LSP的事件因果关系识别在最大熵模型的事件同指消解基础上,提出了一种基于LSP事件因果关系识别的方法。首先基于CEC2.0语料库通过结合事件触发词、事件要素以及关联词,从文本语义和句法结构入手,利用CEC语料现有的标注信息在训练语料中抽取LSP模式;然后通过统计方法分别对抽取的词汇、句法模式结合因果关系共性特征进行关联强度计算来得到LSP候选集;最后通过候选集在测试语料中进行模式匹配,并对匹配出来的事件对进行计算,使大于阈值的事件对为因果关系事件对,以此来实现对突发事件因果关系的识别。实验证明,基于LSP的事件因果关系识别方法在识别效率上与其它的方法相比有较大的提升。图[7]表[11]参[52]
其他文献
为了减少酸碱滴定利用指示剂变色来确定滴定终点的误差,提高分析测定结果的准确度。通过理论分析和实例分析,对酸碱滴定中不同的指示剂、不同浓度的被测物质进行了分析讨论,
<正>以视频为核心,打通搜索、SNS、无线,甚至是出版、影视剧等领域,一个将分散资源聚拢的过程。蒲公英模式赋予传播以无限延伸的力量。传播生生不息周末为爱人做一份浪漫晚餐
本文扼要介绍用华光SR-10型可编程序控制器(以下简称PLC)来改造C650型车床,它与用“继电-接触器”控制相比,不仅工作可靠,线路简单,而且为量大而广的机床改造,提供了充分的依据。特别是采用华光SR-10型
<正>人力资源作为国际工程项目所有资源中最基本、最重要、最具有创造性的资源,是影响项目成效的决定性因素、可变性最大的因素,如何对其有效管理无疑是国际工程项目管理中的
目的探讨实验室信息管理系统在样品管理中使用的重要意义。方法建立实验室信息管理系统,系统与实验室实现内部局域网连接,各实验室将采集HFMD的样本信息、流行病学、临床信息
心电图教学特别是心律失常是临床教学中的重点及难点之一,由于心电图实践性强,涉及的知识较多,要记忆的内容也很多,许多学生一时不知道从何着手。如果按部就班地按常规教学,
<正>一、教学背景分析1.教材分析。"运筹于帷幄之中,决胜于千里之外",运筹学的诞生、发展与战争、军事紧密联系,并被广泛应用于现代社会之中。运筹学是采用科学步骤和数学方
<正> 市委、市政府决定,今年将继续举全市之力打好国有企业改革发展攻坚战,具体工作部署就是一手抓扭亏成果的巩固,继续深化、细化"七个一批"措施;一手抓新经济发展的"三大基
本文结合作者多年的工程实践,汲取了核电项目质量管理的经验,按照策划、实施、检查、改进的原则,从质量保证(QA)和质量控制(QC)两个方面对EPC项目质量管理模式进行了深入研究
数学课外作业是对数学课堂教学的延伸,也是引导学生开展创造性活动,提升学生数学素养的重要载体。但现实中,数学课外作业却处于尴尬境地,学生常常把课外数学作业当作负担,将