基于三体训练与预训练模型的事件抽取研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:songyinming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取是当前自然语言处理领域的研究热点和难点,目的是从大规模、无结构化的自然语言文本中提取反映客观事实的重要事件信息,在智能问答、自动文本摘要、知识图谱构建等多个方向上具有重要的应用价值。事件抽取建模是事件抽取研究的核心问题,传统的统计学习和端到端的深度学习采用监督学习策略进行事件抽取建模易受标记数据规模小、数据稀疏的困扰,且基于流水线方式建模存在误差传播问题。因此,针对上述事件抽取建模的问题,本文提出将事件抽取建模转化为序列标注建模,从三体训练(tri-training)和预训练两个角度对事件抽取展开研究,主要研究工作如下:(1)基于特征模板选择与三体训练的事件抽取。该方法采用联合学习的建模方式,构建基于条件随机场(Conditional Random Field,CRF)的触发词和事件元素联合标注模型。首先基于训练集特征构建多个特征模板,根据十折交叉验证的结果选择最优特征模板。然后将三体训练算法应用于序列标注建模,改进其初始化设置并设计一种确定未标记样本标签序列的机制,确保将高置信度的未标记样本加入标记训练集以扩充实验数据。最后基于最优特征模板和三体训练算法构建Tritraining-CRF模型完成触发词和事件元素的联合标注任务。实验结果表明,Tritraining-CRF能有效缓解数据稀疏和误差传播问题,相比于传统的监督统计学习方法,Tri-training-CRF的事件抽取性能更优。(2)基于预训练BERT的深度神经网络事件抽取。针对统计学习方法建模受制于特征工程而无法提取文本深层上下文特征的问题,该方法引入BERT和Bi LSTM,构建触发词和事件元素的联合标注模型BERT-Bi LSTM-CRF。具体地,利用预训练BERT的模型参数初始化联合标注模型,将每个字转化为蕴含丰富上下文语义信息的字向量。接着将BERT字向量送入Bi LSTM进一步捕获上下文特征以获取触发词和事件元素间的潜在语义关系。最后通过CRF处理Bi LSTM的输出,生成触发词和事件元素的最佳标签序列。实验结果表明,BERT-Bi LSTM-CRF不仅能有效避免特征工程的困扰,还能解决端到端的深度学习方法因标记数据少、数据稀疏而产生的参数学习问题。
其他文献
在现代软件工程中,软件系统通常是通过选择合适的、现成可重用的构件,然后用明晰的软件体系结构组装这些构件来进行开发。这项技术由于能够显著降低软件的开发成本和时间,已在实际的软件行业得到了广泛的应用。然而,软件测试几乎要耗费软件开发资源的一半。因此,如何合理分配测试资源,以耗费尽可能少的测试资源,谋求尽可能大的软件可靠性和尽可能少的测试成本,一直是软件工程领域中的一个热点和难点问题。特别是近年来,以美
Android——作为移动设备中主流智能系统,由于系统源码的开放性以及第三方应用市场稽查力度不足,导致Android恶意软件层出不穷,对用户隐私、财产安全等诸多方面构成严重威胁。在此背景下,如何有效地检测真实场景中的Android恶意软件具有重要的理论和实际意义。近年来,研究学者们致力于Android恶意软件检测工作并取得了不错的成果,但纵观整个检测领域,仍存在两点不足:一是现有工作大多是为提升检
科技化发展使得人们的生产生活问题有了新的解决方式。然而,现实生活中仍然存在着许多因供求双方信息不对称、不透明,信息更新不及时等导致的需求匹配困难问题。区块链技术的发展为这些需求匹配问题提供了新的解决思路。区块链技术的去中心化、不可篡改,以及可追溯的特性,天然地适合于解决供求双方间的信任问题。架设于区块链之上的智能合约,也能够在满足预先设置的条件下,安全、高效地得到令需求方满意地结果。虽然研究人员已
作为新一代人机交互平台,虚拟现实聚焦身临其境的沉浸体验,强调用户连接交互深度而非广度。虚拟化身是用户在虚拟场景中所使用的虚拟形象。应用可由用户身体动作直接实时控制的三维虚拟化身(Avatar)一直被认为是实现虚拟现实深度沉浸感的重要手段。由用户身体动作直接控制虚拟化身的常用解决方案是使用动作捕捉设备实时获取人体运动,再将其转化为虚拟化身运动,从而实现对虚拟化身的控制。现如今,随着虚拟现实环境的普及
随着社交网络和移动互联网的发展,人们不再需要通过报纸、电视新闻等途径了解最新的社会事件,而是可以方便的从社交网站、移动端应用中获取。社会事件的报导也不再是记者的特权,普通的互联网用户也可随时拿出手机拍摄记录周围发生的一切社会事件,并上传分享到社交媒体网站。上传的社会事件一般既包含文本信息又包含视觉信息(图像、视频),并且会跟某些特定的主题相关。因此,从庞大的社交媒体数据中自动挖掘和分类社会事件的热
光在大气中传输时会受到大气中悬浮介质的吸收和散射作用,导致大气散射环境中成像的图像模糊不清、目标物难以辨认。图像去雾技术在目标探测与识别、道路交通监测等军事、民事活动中有着广泛的应用。针对大气散射环境中获取图像严重退化的问题,本文提出了一种基于RGB颜色空间椭球模型的去雾算法,通过在RGB颜色空间建立椭球模型描述雾天图像的像素灰度值的聚集状态,以此估计雾天图像的传输函数并复原目标图像。开展雾天图像
现如今,物联网用户需求的不断增长以及相关应用的发展,给移动设备提出了更高的计算需求、带宽需求、存储需求等。但是受到电池容量以及计算能力的限制,用户不断增长的计算需求和设备有限的资源之间的矛盾成为目前移动物联网架构发展所面临的主要问题。为了解决上述问题,移动边缘计算(Mobile Edge Computing)以及无线携能通信(Simultaneous Wireless Information an
视频作为当今时代承载信息的重要载体,其与人们的生产生活息息相关密不可分,规模也与日俱增。近些年来,随着移动网络与自媒体快速发展,网络上充斥着无穷无尽的视频,这些视频虽然丰富了人们社交生活,但是也确实造成了一定的负担。无论是负载这些视频还是维护,对于媒体信息产业是一种巨大的消耗。此外,在海量的视频中检索与浏览对于用户来说是一件耗时耗力的事情。因此,对视频摘要的技术需求日益加剧。本文利用深度学习的规则
知识表示学习通常用于知识推理等领域,其目标是利用稠密低维的向量表示知识图谱中的实体和关系。在知识图谱自动构建过程中,非结构化文本的复杂性及错误文本的存在,可能致使自动化构建工具不能精确地获取文本中的语义信息,导致实体类型不匹配和实体类型匹配但语义错误等噪音产生。目前较多数的表示学习方法假设知识图谱中的知识是完全正确的,忽略了知识图谱自动构建过程中产生的噪音数据,使实体与关系的向量表示出现误差,严重
在弱光环境下拍摄的图像具有低可见度和低对比度的特点,并且包含严重的噪声。这样的图像不仅给人带来不好的视觉感受,也不利于其他高层计算机视觉任务的研究,如目标追踪、目标检测等。针对这些问题,本文提出了一种基于曝光估计的重建模型来对低照度图像进行增强,同时也将改进的算法应用在单图像去雾任务,本文的工作主要包括以下两点:(1)本文构建了一个基于曝光估计的重建模型用于处理低照度图像增强问题。由于真实的低照度