事件时序关系识别关键技术研究

来源 :苏州大学 | 被引量 : 1次 | 上传用户:emslwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言文本中的事件之间存在各种关系,比如同指关系,时序关系,因果关系等等。其中,事件时序关系识别任务旨在检测事件之间是否存在时序关系并对其进行正确分类。该任务是自然语言处理领域最为重要的任务之一,对许多NLP应用具有重要意义,如文本摘要,故事时间线构建,自动问答等。早期事件时序关系识别的研究主要集中于特征工程方法,考虑到自动化以及领域的适用性,本文提出了一种融合多种信息的神经网络模型来提高事件时序关系识别的性能,具体工作如下:(1)基于图卷积网络的事件时序关系识别方法目前,使用事件最短依存路径进行事件时序关系识别已成为研究主流,但这一做法在去除冗余信息,提取关键信息的同时也造成了信息缺失的问题。并且,目前对于事件时序关系识别任务仍然集中在语义处理上,而忽略了语法结构。针对这些问题,本文提出了一种结合长短时记忆网络(LSTM)和图卷积神经网络(GCN)的模型框架。不同于依存路径只考虑两个事件所在上下文的局部语义信息,该方法采用事件原句作为输入,从词序列和依存句法中自动抽取特征,将语义信息与句法信息相结合,使得模型可以学习到相关事件信息与实体信息,得到更丰富的事件表征。实验结果证明该方法能够有效提升识别效果。(2)融合依存关系和篇章修辞关系的事件时序关系识别已有的研究只考虑了两个事件词在各自的句子层面的相关信息,编码其所在上下文的局部信息,事件间篇章视角的关联关系却被忽略了。针对这一问题,本文给出了一个融合低层句子级依存关系和高层篇章级修辞关系的事件时序关系识别方法。该方法将事件间关联关系分三部分进行表征,一是事件的句子信息,二是事件所在句子的依存路径信息,三是事件所在基本篇章单元(EDU)间的修辞关系信息。基于这一表征体系构建的神经网络模型可以从两个不同层面捕获事件信息,使得时序关系识别的性能得到了显著提高。(3)基于多任务学习的事件时序关系识别本文提出了一种基于多任务学习的模型框架来解决由大量VAGUE类型的关系实例造成的数据不平衡问题。具体来说,本文引进了一个判断事件之间时序关系是否为VAGUE的二分类辅助任务。同时,使用聚焦损失(focal loss)作为目标函数,该损失可以更好地关注难以分类的实例。实验结果表明,这些操作可以有效的缓解数据不平衡的问题,事件时序关系识别任务的性能得到了显著提升。
其他文献
多机器人装配单元在实际生产中具有高自动化和高柔性的特点,可以显著提高生产效率,同时快速适应市场的变化。目前关于机器人装配单元调度优化问题的研究主要集中在以最小化完
工业机器人精密减速器(IRPR)作为工业机器人重要零部件,是制约机器人技术发展重要一环,其高效、高精度测试平台与测试技术已成为推动工业机器人发展与应用关键。本文聚焦传统
在机器人装置艺术的语境下,“机器人工合成生命”话题的艺术研究不应该脱离数字媒介以及现代智能科技的真空语境进行研究,机器人艺术的发展不应该只局限在物理的机器结构研究和静态机器人造型展现。现代科技用各种方式挑战二元论,人和机器的关系中制造和被制造的关系已经变得难以辨析,智能机器人的发展也逐渐分不清什么是心智,什么是身体。从文艺复兴之后至今,从机器到机器人都被赋予了“生命”,他们能说会动,受崇拜,并受统
学位
近年来,电化学传感器在环境监测、生物医学、生物技术、食品安全、医学和临床诊断等领域的应用持续增加。随着灵敏度、选择性等要求的不断提高,单一的修饰材料制备的电化学传
为提高线上购物消费者的再次购买率,商家往往会选择向消费者释放频繁促销和宽松退货策略这两个信号。对商家而言,理解这些信号如何对消费者的再次购买选择发挥作用至关重要。
目前,我国经济已经从高速增长转向高质量发展阶段,科技创新充分发挥了在高质量发展中的支撑和引领作用。而这其中人才资源作为一种重要的资源,是一个企业可持续发展的重要支
建筑行业在近二十年来发展迅速,并已经成为我国的支柱型产业,但单一的建筑行业发展所导致的是我国当前的国民经济体系不平衡,过高的房价对比人均收入,让我国的人民幸福程度很难得到提高。在这样的情况下对建筑行业的成本控制进行研究,一方面能够帮助建筑行业以更良性化的方式进行发展,另一方面也可以让房价上扬的趋势得到一定的减缓。而本文的研究对象腾讯智慧建筑项目本身与建筑项目之间存在着一定的差别,前者更多的是在为后
本文的目的是通过基于植物智能的生态艺术实践即《植物智能计划》探讨“生态关系”对于生态艺术的形式和内容的价值。随着生态学、生态哲学、生物学和生物科技等领域的发展,这在形式和内容上为生态艺术创作带来了新的可能,另外,当今生态艺术的创作转向跨学科研究的范式,本文正是在上述背景下展开的研究。研究对象:生态艺术的形式与内容以及“生态关系”对于其形式和内容的价值。研究方法:以《植物智能计划》生态艺术实践作为主
学位
现今对于移动社交网络的研究主要是网络拓扑结构演化模型分析、谣言传播模型建立和控制策略以及谣言溯源探究和预测等,其中谣言传播模型建立和控制策略已成为情报科学以及其
随着我国油气工业和信息技术的不断发展,企业的营销环境也发生了根本性的变化。对于石油管材企业来讲,传统的营销方式已经远远不能适应新的市场营销环境。企业要想在市场竞争