文本中事件因果关系识别方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ywbll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件因果推理是人工智能实现从感知到认知的核心问题之一,具有重要的理论研究价值和广泛的应用场景。现有的文本中事件因果关系识别方法往往注重于挖掘输入文本中的序列特征,但忽略了事件间的结构联系,难以建模远距离事件间的因果联系;同时,现有的事件因果识别方法主要聚焦于事件实例层级,存在预测结果不一致的问题,或需要额外的约束解决冲突,导致模型的复杂度较高。针对上述问题,本文结合了依存句法树信息和注意力机制,增强事件间的结构联系。进而,使用图神经网络进行概念级事件因果关系识别。主要研究内容包括:针对现有方法难以捕捉长距离依赖的问题,本文首先研究了一种句法信息增强的实例级事件因果关系识别方法。该方法在抽取文本序列特征的基础上,使用句法分析技术得到事件所在句子的依存句法树,并从中抽取事件对在依存句法树中的路径,有效缩短了事件对之间的距离。随后,利用注意力机制融合文本序列特征和句法路径信息,以增强事件的语义表示能力。在事件因果关系识别领域规模最大的数据集Event Story Line上的实验结果显示,该方法相对于BERT等基线模型有明显的性能提升,F1指标提升3.5%。现有的事件实例级因果识别方法,在预测两个事件概念组成的多个事件实例对时可能存在冲突,导致预测结果不一致;或需要额外约束解决冲突,使得模型复杂度较高。针对这些问题,本文提出一种基于图神经网络的概念级事件因果关系识别方法。该方法利用图神经网络同时建模事件实例和事件概念节点,根据共指、共现等关系连接相关节点,构建异构图。在图表示学习过程中,利用BERT对节点表示进行初始化,进而通过图卷积操作实现节点间的多跳信息交流,增强语义表示。最后,通过基于注意力的路径推理机制,融合事件子图中不同路径的语义信息。该方法可以同时实现事件实例和事件概念节点间的因果推理,在无需额外约束的情况下解决了预测结果不一致的问题。在Event Story Line上的实验结果显示,这一方法在事件实例层级相比基线模型提升了7.3%,同时在事件概念层级达到了目前已知的最高性能。
其他文献
社交媒体在人们的生活中扮演着不可或缺的角色,大量的用户在社交媒体中对各种话题发表自己的观点,表达自己的立场。社交媒体文本中蕴含的立场态度信息能够辅助政策制订,帮助了解用户偏好,具有重要的科学研究价值和应用前景。现有方法在具备充足标注数据的立场检测任务上已经取得较好的性能。但在实际场景中,社交媒体上不断涌现出海量新话题,对所有新话题进行立场标签标注用于训练是不切实际的。针对这一问题,本文研究少样本场
学位
背景精神分裂症(Schizophrenia)作为一种严重精神疾病,其患病率高,疾病负担大。精神分裂症患者的预期寿命比一般人群低20%,其中合并心血管疾病风险和由此导致的死亡率是正常人的三倍以上。精神分裂症患者各种代谢紊乱,特别是心血管健康相关指标的异常改变(血压血脂血糖等异常)增加了心血管疾病发生风险并使得其寿命降低10-25年。近年来空气污染短期暴露引起心血管异常损害引起重要关注,但在精神分裂症
学位
电力网络作为重要的能源输送和配置平台,其安全状况与电力系统稳定运行密切相关。近年来,工程车辆及火灾造成电力基础设施损坏的事故层出不穷。这些事故难以预控,一旦发生很难在短时间内得到解决,造成无法弥补的损失。随着智能电网概念兴起和计算机视觉的快速发展,基于视觉的方法能够自动检测入侵电力网络的外物,并根据实际情况进行安全预警识别。这种方式使巡检效率大幅提高,减少人为失误带来的损失。受电网工作环境、采集时
学位
研究背景系统性红斑狼疮(systemic lupus erythematosus,SLE)是一种严重的自身免疫性疾病,常累及多器官系统且其临床表现多样,好发于育龄妇女。据报道,70~80%的SLE患者会出现皮肤症状,25%的SLE患者首发皮肤症状。然而,鉴别SLE患者的皮肤症状存在困难,因而容易延误SLE的诊断和治疗。皮肤作为人体最大的器官,不仅存在共生有益的微生物,也存在潜在致病的微生物。有研究
学位
目的:1.探讨B7-H3和B7-H4基因单核苷酸多态性与强直性脊柱炎易感性之间的关联性;2.检测AS患者中B7-H3基因启动子区域甲基化水平及其m RNA表达水平,在表观遗传学水平上探讨B7-H3基因在AS发病机制中的作用。方法:1.本次研究分为两个部分,第一部分,本研究在安徽医科大学第一附属医院风湿免疫科收集了649例确诊AS患者,同时在安徽医科大学第一附属医院体检中心和合肥市中心血站收取性别和
学位
目的探讨线粒体DNA拷贝数(Mitochondrial DNA Copy Number,mt DNAcn)与系统性红斑狼疮(Systemic Lupus Erythematosus,SLE)发病、糖皮质激素(Glucocorticoids,GC)疗效及预后的关联,及其与环境因素和肿瘤坏死因子受体相关蛋白1(Tumor Necrosis Factor Receptor-associated Prot
学位
X光胸片是应对肺部区域疾病最常用的影像学检查方式之一,在其基础之上进行准确的肺部区域分割有着十分重要的意义。其分割结果既可以提供肺部区域的空间信息,辅助医生对于肺部疾病的诊断,也可以去除X光胸片中非肺部区域,避免其对于图像处理和诊断分析的影响。本文主要致力于基于X胸片的肺部区域分割方法的研究,针对已有工作存在的问题和不足,提出了三种X胸片的肺部区域分割方法。具体内容如下:针对分割结果不准确和不符合
学位
背景:精神分裂症患者心脑血管疾病的发病率显著高于健康人群,这是导致该病高致残率、高死亡率最主要的原因之一。血脂异常会增加多种心脑血管疾病发生和发展的风险,细颗粒物(particulate matter with an aerodynamic diameter≤2.5μm,PM2.5)与血脂水平变化之间的关联已有报道,而专病人群对于环境危险因素可能更加易感。本研究基于社区的慢性稳定期精神分裂症患者开
学位
脑肿瘤是生长在大脑里的不正常细胞群,对人们的生命健康造成严重威胁。将肿瘤区域正确划分出来是脑肿瘤治疗和诊断中不可缺少的一步。临床通过核磁共振成像(Magnetic Resonance Imaging,MRI)获取包含不同信息的多模态MRI脑部图像用于颅内结构的观测。现有的方法主要提取MRI图像的多模态混合信息或单一模态独立信息,缺乏对混合信息和独立信息的结合。此外脑肿瘤分割任务中的目标尺寸不一致问
学位
恶意代码的检测一直是网络空间安全中最重要的研究课题之一,近年来,随着机器学习及深度学习技术的发展,深度神经网络模型已经逐渐应用于恶意代码检测,并在应用中取得了不错的效果。然而,最近的研究表明,深度学习模型自身存在不安全因素,容易遭受对抗样本攻击。在不改变恶意代码原有功能的前提下,攻击者通过对恶意代码做少量修改,可以误导恶意代码检测器做出错误的决策,造成恶意代码的漏报。为此,本文从攻防两个角度,研究
学位