基于句子类别信息的事件检测研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:syh95815
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件检测是信息抽取领域的一个重要子任务,其主要目的是根据上下文识别出句子中的触发词及其事件类别,对于开发自动信息提取技术有着重要的意义。自然语言中事件信息的多样性为该任务带来了很大的挑战,本文从研究句子事件类别信息的角度入手,主要研究内容如下:(1)基于句子类别聚类的事件检测方法针对目前大部分事件检测研究忽略了句子之间事件关联的问题,本文从事件聚类角度出发,提出了一种基于句子类别聚类的事件检测方法。通过基于半监督学习的事件聚类模型,构建句子之间的事件关联,获取句子的聚类类别特征。实验表明,将句子的聚类类别特征融入事件检测模型后,模型在ACE中英文数据集上均有所提高。(2)基于句子类别分类的事件检测方法针对之前的问题,本文从事件分类角度出发,提出了一种基于句子类别分类的事件检测方法。通过基于BERT和注意力机制的句子事件分类模型,获取句子分类类别特征。为了进一步利用事件类别标签的文本信息,本文采用机器阅读理解模型的方法在句粒度融合事件类别特征,结合对比学习模块拉近同类别触发词之间的距离。实验表明,该模型在ACE中英文数据集上相比基准模型均有较大提升。(3)基于句子层次事件类别的事件检测方法针对目前大部分事件检测研究忽略了触发词之间层次事件关联的问题,本文提出了基于句子层次事件类别的事件检测方法。根据训练集中触发词之间的事件类别关联和上层类别关联,分别构建触发词图。基于所在句子的层次事件类别信息,将候选词与图中节点关联,在词粒度融合事件类别信息。结合候选词的动态多池化特征,进行触发词分类。该模型在ACE中英文数据集上相比基准模型均有明显提高。本文分别通过事件聚类和事件分类获取句子类别信息,用于事件检测。由于句子分类类别特征更为复杂,本文分别从句粒度和词粒度出发,学习句子和触发词之间的事件关联。最终实验表明了句子类别信息对于事件检测任务的重要性。
其他文献
模仿学习是一种不依赖环境奖赏信息,从专家样本中学习最优策略的方法。生成对抗模仿学习结合模仿学习的决策能力与生成对抗网络的表征能力,在高维连续控制任务中展现了强大的智能性和良好的普适性,已经成为模仿学习领域的研究热点之一。然而,生成对抗模仿学习在模态表征能力、算法稳定性以及样本利用率方面存缺陷,严重限制了其在复杂现实任务中的应用。针对以上生成对抗模仿学习在对抗训练过程中出现的三个问题,本文提出了解决
学位
情绪分析作为情感分析的一个重要分支,因其广泛的应用而成为自然语言处理的研究热点。随着互联网的飞速发展,越来越多的人喜欢在以微博、推特为首的社交媒体平台上宣泄情绪,因此微博存在海量的情绪表达文本。目前,相对于英文情绪分析数据集,中文的情绪分析数据集较少。挖掘微博数据,构建高质量情绪分析数据集,对研究情绪分析具有十分重要的意义。然而,微博和推特存在文本短小、信息表达有限的问题,过去大多方法只考虑文本语
学位
近年来,文本和图像的细粒度语义匹配研究吸引了工业界和学术界研究人员越来越多的关注。文本和图像的细粒度对齐信息(例如:对齐图片中的目标对象与文本中涉及的短语实体)可以被广泛应用于很多重要的应用场景,例如:多模态检索、多模态情感分析、个性化推荐系统和线下门店数字化等。传统的文本图像细粒度匹配任务,旨在对齐图片和文本中的细粒度实体,并未就这些细粒度实体进行深入语义分析。本文通过语料分析发现,大多数用于描
学位
目的 探讨手法松解联合核心肌群训练治疗神经根型颈椎病的疗效及对血液流变学的影响。方法 选择2018年3月至2021年2月南京市高淳中医院收治的86例神经根型颈椎病患者为研究对象,按照数字表法随机分为对照组和联合组各43例。对照组采用核心肌群训练,联合组采用手法松解联合核心肌群训练,2组均持续干预4周。对比2组临床疗效及干预前、干预4周后颈椎病临床评价量表(CASCS)、视觉模拟评分法(VAS)评分
期刊
将深度学习与强化学习结合已经成为了一种主流趋势,但将其运用到现实环境还面临许多的挑战,仍需要大量的训练数据、高维度的观测空间以及精确的智能体输出端口,这些都需要更强大的探索算法,探索性的缺失将导致算法在多峰值函数的更新中陷入局部最优;然而过度的探索也会导致算法性能的下降,使算法的收敛速度下降。因此,如何平衡探索与利用的关系,加快算法的收敛速度,成为了强化学习算法的一个挑战。为了缓解上述问题,本文主
学位
2018年11月5日,科创板设立并试点注册制,国家设立科创板目的是给企业创新营造一个良好的资本市场环境,进而提升国家整体实力。科创板上市企业大部分是硬科技企业,具有的普遍特征是研发支出多。由于研发活动具有较高的资金风险,所以要准备充足的自由现金流规避资金风险。充足的自由现金流是企业进行研发支出,开展研发活动的驱动因素,研发支出的增加利于企业提高自身的创新能力,创新能力的提高可以有效促进企业实现可持
学位
最近,人机对话系统因其巨大的学术价值和商业价值而受到越来越多的关注。随着社交媒体和深度学习技术的迅猛发展,聊天机器人在生活中发挥着广泛的作用,它不仅可以满足人们的沟通需求,而且节省了企业的服务成本。为了更符合实际应用,人们往往研究多轮对话生成系统,这样可以利用更多的历史对话信息,同时也对如何更好地捕捉符合对话场景的特征提出了新的挑战。为了更好地对上下文信息进行建模,在多轮对话生成中,需要针对对话约
学位
互联网自问世以来,引发了席卷全球的信息化潮流,并逐步将第三次科技革命推向高潮,对人类生活的方方面面发起了颠覆性的改变。在此浪潮之中,诸多互联网企业迅速成长,研发出新颖的盈利模式、商业模式和先进技术,普遍具备高成长、高风险的特征。近年来,针对这一类企业的估值问题逐渐成为业界关注的焦点。但是这些企业收益的不确定性、市场数据和历史估值数据匮乏,直接导致了盲目套用传统估值方法往往造成结果上的巨大偏差,也使
学位
在我国,民歌是不同民族、地域、时代风土人情和人文精神的一种展示。作为传承地方音乐文化的载体,民歌是音乐鉴赏教学中不可或缺的一部分。在2017版《普通高中音乐课程标准》中明确了“弘扬民族音乐”的基本理念,音乐教育者开始密切关注音乐学科核心素养。其中引导学生通过音乐感知和艺术表现等途径,理解不同文化语境中音乐艺术的人文内涵是高中音乐鉴赏教学中的重要目标。在民歌鉴赏课中,从文化理解的视域引导学生理解民歌
学位
随着移动互联网的飞速发展以及大数据时代的来临,用户通过终端能获得的信息量爆炸式增长,产生了“信息过载”。为了从海量信息中挖掘到用户感兴趣的信息,推荐系统应运而生。其中,POI(Point of Interest)推荐是推荐系统中的重要场景。POI推荐旨在根据用户的历史交互序列,学习出更准确的用户兴趣表示,以便于向户推荐感兴趣的景点。但在现实生活中,历史交互序列无法反映出用户的当前动态偏好。而对话推
学位