端到端篇章级时序信息抽取研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:juejiang12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言文本中的信息多种多样,如时序信息、空间信息、语义角色信息等。其中,时序信息抽取任务旨在识别出文本中的时序对象,并从时间角度上对时序对象间的先后关系进行正确分类。该任务中抽取出的时序信息有助于自动问答、文本摘要等下游任务,在自然语言处理领域发挥着不可忽视的作用。分析时序信息抽取的研究现状可以发现,该研究领域存在三个明显的问题:(1)方法多采用传统的特征工程,自动化程度偏低,且领域适用性不足;(2)时序关系抽取的性能受限于语料规模和严重的不平衡现象;(3)孤立考虑某一类时序信息,缺乏对多种时序信息间互补性的挖掘。本文围绕上述问题开展了研究工作,具体如下:(1)为了摆脱对于手工规则与特征的依赖,本文提出了一种将双向长短期记忆网络与图卷积结合的时序对象抽取模型,该模型实现了文本中语义特征和语法特征的自动学习。考虑到同为时序对象的时间表达式与事件之间的关联,本文进而在该模型的基础上以共享表征的方式进行了两者的联合抽取实验。(2)针对目前语料中不确定(VAGUE)类型占比近半导致的时序关系样本的不平衡问题,本文提出了一种使用多任务框架的篇章级时序关系抽取方法。一方面,解码层增加二分类的辅助任务鉴别时序对象间的关系是否为VAGUE,提升模型对不平衡数据的处理能力,另一方面,引入聚焦损失加强对困难样本信息的挖掘。针对多种时序对象间互补信息的挖掘问题,在多任务框架下,本文以不同网络层参数共享的方式增强事件与事件(E-E)、事件与时间表达式(E-T)时序关系间的信息交互,实现两者的联合抽取。(3)最后本文结合以上研究内容,在联合学习框架下构建了一个端到端的篇章级时序关系抽取模型。实验结果证实该模型能够避免传统的串联抽取方法产生的误差累积。
其他文献
直线段是一类重要的图像特征,能够有效表达场景的几何信息和拓扑信息。现有的直线段检测方法广泛存在直线段端点定位不准或方向不准等问题,且均针对灰度图像来设计检测方案,丢失了图像的部分彩色信息,从而导致检测效果不理想。在评估直线段检测结果时也存在一些明显的问题,如检测到的直线段与真实直线段之间的映射关系不合理,未对直线段过融合、过分割和方向偏差进行惩罚等,无法有效反映检测算法的真实性能。针对直线段端点定
学位
文章介绍了气象观测质量管理体系建设的依据及江西省气象观测质量管理体系建设和运行过程,总结了体系持续运行的经验和体系运行中的常见问题。实践证明,气象观测质量管理体系的建设与运行促进了综合气象观测业务发展。
期刊
目的1)了解慢性阻塞性肺疾病(Chronic Obstructive Pulmonary Disease,COPD)患者吸入制剂使用依从性的现状。2)探索基于目视管理法的可视化健康教育对COPD患者吸入制剂使用依从性、吸入制剂使用方法掌握程度、肺功能、生活质量及运动耐量的影响。3)比较基于目视管理法的可视化健康教育和常规健康教育的应用效果,为改善COPD患者吸入制剂使用依从性提供理论及实践基础。方
学位
近年来,多轮对话回复生成任务的研究受到了学术界和工业界的广泛关注,其让计算机能够通过阅读并理解多轮对话的内容,进行逻辑分析从而给出一个契合对话内容的回复语句。一方面,多轮对话生成研究是自然语言处理领域的一项基本研究任务,对其进行深入研究有利于推动人工智能和自然语言领域的发展;另一方面,其可以满足用户交流的需求,在电商领域的应用可以起到降低人力成本的作用。本文主要针对多轮次对话回复生成展开研究,具体
学位
互联网中存在大量的文本数据,如何将其中非结构化数据转化为人们易于理解的结构化信息,是一个值得思考的问题。实体属性抽取,是将非结构化文本数据转化为结构化数据的一种重要方式,其定义是:给定一个实体及其属性列表,从非结构化文本中抽取出该实体的各个属性值。本文主要研究基于大规模文本数据的实体属性抽取,从大规模文本数据中抽取出实体相应的属性值,构建结构化三元组知识。主要内容如下:(1)研究基于远程监督的人物
学位
元强化学习(Meta-RL)结合了元学习和深度强化学习,是目前机器学习领域的研究热点之一。Meta-RL算法从一系列任务中学习并提取先验知识,从而利用先验知识快速适应新的任务。传统Meta-RL算法存在元训练计算量过大、训练时间过长、样本利用率低等问题。基于任务推断的元强化学习算法通过引入任务信念来形式化表征任务,将元强化学习问题转化为在线的任务信念推断与基于任务信念的策略学习问题,并结合了异策略
学位
实体关系抽取旨在从文本中抽取出实体之间的语义关系,是自然语言处理的一项基本任务。在新闻报道、维基百科等规范文本上该任务的研究相对丰富,已经取得了一定的成果,但面向对话文本的相关研究还处于起始阶段。随着对话系统相关研究逐渐深入,对话场景中实体关系抽取的重要性日渐显露,研究者们试图借助抽取到的实体关系进行对话文本的场景焦点识别、对话场景的知识增强,以期更好地理解对话文本。相较于规范文本,目前用于实体关
学位
文献指数增长,研究者们需要花费大量时间进行文献查找。已有的推荐方法通过计算文献之间的相似性对推荐结果进行排序,忽略了文献之间的语义和主题相关性、多层引用关联性和推荐过程的解释性,不能很好地对相关领域的文献进行面向主题的查新。本文提出了新的文献推荐方法,对于给定的查询文献的标题、摘要和关键词,能够进行面向主题的相关文献查新,让研究者们了解该查询文献研究领域的最新研究进展。具体工作如下:(1)为了能够
学位
在移动互联网、大数据技术日渐成熟的时代,各领域的数据以指数级规模迅速增加。然而数据就像一把双刃剑,虽然方便了人们的生活,却也带来了信息过载的问题。针对用户历史记录的个性化推荐服务能够缓解这一问题,并且能提升用户在购物平台的体验,所以下一个购物篮推荐成为学术界和工业界的研究重点。在下一个购物篮推荐任务中,普遍存在物品与用户关系、用户购物的顺序模式难以挖掘、用户兴趣偏好难以表示等问题,引起了众多学者的
学位
针对机器人在加工和装配等领域应用时存在精度等方面的不足,提出了一种多电机共轴驱动的七自由度机械臂设计方案,在机械臂的腰、肩、肘关节处布置了双电机共轴驱动的关节结构。提出了双电机共轴驱动的消隙控制方法和同步控制方法,并给出了上述两种控制算法之间平滑切换的转换条件。在底层控制基础上,应用ROS和EtherCAT总线技术搭建了机械臂的上层控制系统。结果表明,本文设计的七自由度机械臂系统在精度、负载能力上
期刊