中文事件抽取与缺失角色填充的研究

被引量 : 0次 | 上传用户:linuxedit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取(Event Extraction)是信息抽取(Information Extraction,简称IE)的难点之一,它研究的内容是如何从文本中抽取特定类别的事件及其角色。目前,绝大多数的研究对象是英文,对中文事件抽取的研究还处于起步阶段。本文在深入研究现有中文事件抽取方法的基础上,提出了新的方法并挖掘出更有效的特征。另外,通过对事件抽取结果的分析发现,完整的事件信息往往分布在文档的各个部分。针对目前事件抽取技术局限在当前句子,从而造成大量事件论元角色缺失的现象,提出了基于跨事件的缺失事件角色填充方法。本文研究内容主要包括:1.针对中文特点,提出了采用CRF(Conditional Random Fields)模型基于字的触发词探测方法,解决了中文自动分词与中文事件触发词边界不一致的问题。此外,在事件类型识别阶段,首次引入跨事件推理,使得特征选取由局部扩展到全局。在ACE2005中文语料上的实验表明,本文提出的两种方法既可以有效提高触发词识别的准确率,又有助于提高事件类型识别性能,F1值分别比现有系统提高5.5和2.5个百分点。2.研究了基于CRF模型的事件论元角色抽取任务中多种特征的表现,并将其归纳为词法、语义、依存特征、句法和相对位置等五大类别。考察了各种特征及特征之间组合对系统性能的影响,并重点引入了语义角色标注特征。实验表明,条件随机场模型在事件论元角色抽取方面有较好的表现,且新提出的语义角色特征具有很好的指示作用。F1较现有系统提高5.1个百分点。3.对ACE2005中文语料进行了后期标注,并通过对缺失事件角色的分析和统计,提出了一个基于机器学习的缺失事件角色填充方法。该方法把缺失事件角色填充分为识别和分类两个部分,识别阶段用于判定缺失角色是否可被填充,分类阶段用于从其它事件描述中选择合适的角色(实体)对可被填充的缺失角色进行填充。实验表明,两个阶段的F1值分别达到72.97和74.68。
其他文献
目前我国快递行业处于发展的跨越期,本土企业虽成长迅速,但却内外交困,问题层出不穷,行业亟待升级转型。本文从美国管理学家迈克尔·波特的钻石模型出发,从模型的四个方面—
以氨法吸收CO2过程为研究对象,针对气液两相之间传热/传质及反应模型的区别,对比了RK(rate-based,kinetic),RC(rate-based,chemistry),EK(equilibrium-based,kinetic)and EC(
弹载压电传感器调理电路因测试环境的特殊性,难以采用精密的高输入阻抗电荷放大器。本文针对该问题设计了小体积的调理电路,并针对该测量电路因低频特性不足而导致的低频信号
从能源、环保、质量及使用范围等方面,综合介绍了大同市当前建筑行业砌筑材料的使用现状,各种砌筑材料的优缺点与适用范围,论述了建筑业砌筑主体材料的发展状况。
在大众化教育背景下,高校必须创新教育理念,以培养"创新、创业、创优"的"三创"型人才为追求,将创业教育纳入常规教育体系中。坚持以市场为导向,以课程为基础,以载体为依托,以
目的探讨前后稀释模式肾替代治疗多器官功能障碍综合征(MODS)患者的效果。方法选择我院2011年1月至2013年1月间收治的60例MODS患者随机分为两组各30例,所有患者均积极治疗原
小车倒立摆系统作为1个典型的不稳定非线性系统,是进行控制理论教学及开展各种控制实验的理想实验平台,对小车倒立摆系统的控制分解为2部分:一部分称为"摆杆控制",采用T-S模
<正>近年来,建设银行内部审计的功能已经从传统的防弊纠错,经过积极兴利,发展到以价值增值为主要目标的新阶段。实行增值型内部审计是适应当前经济全球化大环境的需要,也是现
<正>一、我省乡镇财政管理现状近年来,我省的乡镇财政管理从弱到强,初步形成机构较健全、体制较合理、职能较完善、手段较先进、管理较规范的乡镇财政管理运行机制。(一)完善
随着高校的扩招,毕业生就业形势依然十分严峻,特别是高校有部分毕业生在人才市场竞争中由于各种原因成为就业困难群体,因此加强了解高校毕业生就业困难群体的情况,分析高校毕