面向低资源数据的中文事件抽取研究

被引量 : 0次 | 上传用户:erhtyyuk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取作为信息抽取的核心子任务,其对于互联网的信息化处理起着至关重要的作用。而受限领域多、样本少的困境,事件抽取的模型往往得不到充分的训练,因此如何在低资源的场景下构建中文事件抽取模型是一个非常值得探索的问题。本文重点围绕低资源的中文事件抽取展开研究,主要的研究内容如下:(1)基于字词联合表示的中文事件抽取方法首先,针对在低资源下中文单个词语或字都难以有效地表达事件触发词的情况,本文提出一种基于字词联合表示的中文事件抽取模型。该模型通过图卷积神经网络融合字词级别的语义信息,利用动态策略算法来识别触发词的边界。通过对比实验分析,该模型在ACE2005上F1值超过了最佳基准模型3.3%。(2)跨语言数据增强的中文事件抽取方法其次,为了能够更好地扩充已有的中文数据集,本文提出利用现有的英文语料来扩充中文语料,一定程度上缓解了因为低资源场景下带来的训练不充分问题。该方法将英文语料对齐翻译到中文下,并通过主动学习策略过滤噪音数据。最后在数据集ACE2005上进行相关对比实验,相比最佳的基础模型在F1值上有1.4%的提升。(3)基于多任务学习的中文事件抽取方法最后,为了在小规模数据集下提升事件抽取模型的泛化能力,本文提出了一种基于多任务学习的事件抽取模型,通过学习不同任务之间的互补信息,增强主任务的特征捕获能力。以对话系统中的槽值填充和意图识别任务为模板,提出了句子级的事件抽取辅助任务,利用句子的整体语义信息辅助事件抽取模型精确识别事件类型,进一步提升模型的识别能力。此外,为了弥补因为BERT的掩码策略带来的不足,借鉴SpanBERT的思想,使用块状目标预测来增强模型识别词语边界的能力。最终在数据集ACE2005上F1值超过了最佳的基准系统1.6%。综上,本文分别从语言内部建模、外部数据扩充、辅助任务增强三个角度出发,通过提升模型的泛化能力,大大提高了低资源下中文事件抽取模型的性能。
其他文献
20世纪中期,东南亚多国先后出现排华潮,大量华人华侨以“难侨”身份被迫返回祖国。难侨独特的生命历程和空间实践,使其展演出不同的身份协商过程和国家认同变迁。本文以珠海市原红旗华侨农场的越南难侨为研究对象,采用定性研究方法,剖析其在归国前后不同时期和不同空间的各方互动中身份协商和国家认同的演变过程。研究指出:越南难侨在群体互动、政府政策以及社会支持的影响下,在归国之前、归国初期和归国后期有着明显的身份
<正>山体崩塌、滑坡、泥石流是自然地质作用,地质灾害风险防控既是一项需要持续发展的综合性、系统性工程,具有很强的专业性,离不开科技支撑,又是一项涉及千家万户生命财产安全的社会性工作。党的十八大以来,我国地质灾害风险防御工作取得了显著进步,大规模风险隐患调查与动态巡查、重大地质灾害应对及承灾能力和水平得到明显提升,成效十分显著。但是,
期刊
<正>幼儿园的艺术博物馆是基于幼儿的发展水平所设立的艺术空间。它集收藏、展示、体验和交流为一体,拟通过开展形式和内容多样的艺术博物课程活动来扩展幼儿的视野,提升幼儿的审美、探究、语言、问题解决等能力。幼儿园艺术博物馆对儿童发展具有独特价值,它既是一种教育设施,也是一种课程资源[1]。一、“现场学习”视域下幼儿园艺术博物馆课程的内涵“现场学习”是指通过创设一种有利于幼儿学习和发展的特定场所来让幼儿在
期刊
含梅精矿混合料烧结过程对水分十分敏感,适当的烧结混合料水分对于改善梅钢烧结矿的质量和提高产量非常有利,但过多的水分会导致烧结热量不足,影响烧结的进行。为确定梅山钢铁公司(以下简称“梅钢”)5号烧结机梅钢混合料水分的最佳含量,本文以梅钢5#烧结机的实际生产配矿结构为基础,研究了混合料水分对梅精矿烧结过程、烧结矿强度和烧结矿冶金性能的影响。试验结果表明:在基准条件下,当混合料水分为7.5%时,烧结各项
目的 探讨充气式高分子凝胶体位垫在截石位手术中的应用效果。方法 回顾性分析2020年1月至6月于赣南医学院第一附属医院100例行截石位手术的患者资料,按其应用的体位垫分为对照组和研究组,每组各50例。对照组使用常规棉布体位垫,研究组使用充气式高分子凝胶体位垫。比较两组的血流动力学指标[中心静脉压(CVP)、收缩压(SBP)、舒张压(DBP)]、Braden压疮评分、视觉模拟评分法(VAS)评分、压
《觉醒年代》是一部展现建党前相关历史的电视剧,它分别在立意、隐形信息、人物、历史记忆等四个方面达成了阿尔都塞式的意识形态即“想象性认同”过程。观众通过对该剧的创作目的性、影像意义、典型形象塑造、现实社会的镜像等方面的认识建立了“想象性认同”,由此体现出对《觉醒年代》的认同感。
随着城市人口老龄化的发展,养老不仅关乎老年人的晚年生活,更是关乎国家民生大事。在“互联网”大背景下,养老服务智慧化转型是一种必然趋势,能解决当下人力不足、资源不足、少子化、高赡养比等问题。但是智慧养老目前仍处于刚起步阶段,现阶段信息技术、智能设备都处于研究、开发和应用的初级阶段,所能提供的服务内容单一、服务质量不高,此外老年人对于智慧养老也处于一知半解、不了解的状态。“十四五”规划提出,要“优先发