基于时间的图注意力因果发现模型

来源 :吉林大学 | 被引量 : 0次 | 上传用户:heinblue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提取实体之间的因果关系是获取因果关系知识的基础,也是自然语言理解(Natural language understanding,NLU)任务的一个基本步骤。因果关系往往伴随着实体的时间线索:一个实体的因果关系总是状态的变化或行为的变化,这些变化伴随着时间的变化。据我们所知,时间因果关系提取没有得到与其重要性相一致的足够重视,对于时间因果关系的研究几乎没有,同时带有时间关系和因果关系的数据集更是少之又少。针对当前的序列标注、文本分类和关系抽取这三种主流方法,本文根据基于时间因果关系抽取的研究任务需求,确定了采用序列标注的方法结合时间关系抽取文本中的因果实体,无需其他因果知识背景和特征工程。本文的主要贡献是:1.在基础概念和研究方法上,基于当前已经存在的因果关系抽取研究方法,列举当前国内外研究现状并做出详细地分析与总结,同时结合应用在因果抽取方向上的时间关系研究,使读者了解因果方向的领域研究;2.在算法模型上,使用基于时间关系的图注意力网络(T-GAT)的概念,即将图注意力机制应用于时间关系中;使用基于因果知识图谱的图注意力网络(C-GAT)的概念,即使用因果知识图谱提取GAT使用的邻接矩阵;提出均衡机制(Equilibrium mechanism)平衡两个模块的输出,平衡时间关系的负面影响。结合深度学习的知识,提出了TC-GAT(BERT+T-GAT+C-GAT+Equilibrium)因果关系抽取模型预测句子中每个词对应的因果标签。3.在标注方法上,首先介绍了时间关系类型,并根据实际需求确定时间标注类型,经过现有因果序列标注方法进行多角度分析,确定采用“核心因果词”的方法标注时间和因果关系,降低标注难度;4.在实验数据上,对现有的因果关系数据集进行了全面的分析和总结,列举其标注方法和标注准则;根据实验需要,最终选取了Sem Eval2010-Task8和Altlex数据集,对其进行行修正和扩展,同时标注了因果关系和时间关系标签,创建新的时间因果数据集TC-Sem Eval2010-Task8和TC-Altlex;5.在实验结果上,通过在时间因果数据集TC-Sem Eval2010-Task8和TC-Altlex上进行实验,实验结果表明,与传统的基线模型相比,我们的模型在因果关系提取任务上的性能有了明显的提高,证明了时间关系对抽取因果关系是有帮助作用的。最后,更进一步探究本文的模型在该方向的可延伸性。
其他文献
随着我国发展模式的不断转变,经济结构的逐步优化,治理能力现代化水平的不断提高,财政收入呈现增长趋势,财政资金支出需求也与日俱增,各地区的财政收支矛盾也成为财政改革进程中的重要问题,如何提升财政资金的使用效益,优化资源配置是政府管理中面临的重大难题。在国家治理的过程中财政作为核心基础和重要支撑,也急需不断进行制度的深化改革来适应社会经济的高速发展,不断推进完善资金管理体系。党的十九大报告中提出了“建
学位
随着时代的进步和科技的发展,现代社会的生活方式已经有了翻天覆地的变化,在我们日常生活的各个角落,信息技术和互联网都起到了重要的作用。各级政府部门也在“互联网+政务服务”的背景下探索了更多的服务途径,社会保险在保障民生方面具有社会稳定器的重要作用。然而,随着社会的发展,传统的社会保险服务平台已经无法满足群众多样化的社会保险经办需求,为保障社会保险经办领域服务质量,提升参保群众对社会保险服务平台的满意
学位
济南,作为城市的发展,始终是在北纬36度附近按照太阳运行的轨迹而拓展。所以,这个城市永远有着金色的城际线、光辉的道路。在现在市区东部的几十公里范围内,众多历史遗存密集遍布。尤其是两座汉代古墓的开掘,更见证了2000多年前这座城市的繁华和辉煌。
期刊
在如今的信息时代,互联网相关技术已应用于诸多领域。知识图谱技术是其中一项用于表示海量信息及其关系的重要技术。为了保持知识图谱中知识的固有结构并且便于计算,人们提出了知识图谱嵌入技术,用嵌入向量表示知识图谱中的实体和关系。知识图谱子图是知识图谱的一部分,一般是在给定知识图谱上按照一定策略构建的,其具体大小可根据实际需要来设定。相比于原知识图谱,对于知识图谱子图的研究,有如下优势:1、对于较为庞大的知
学位
2007年以来,大学生职业发展与就业指导课程开发工作受到教育部及社会各界的高度重视,相关的课程体系建设及成效也备受社会关注。本课题组通过对生涯教育体系的问卷调查,分析了课程体系的实施效果,以期在实践基础上为进一步完善这一课程体系提供参考。
期刊
目的 探讨低钙腹膜透析液对肾衰竭患者钙磷代谢及肾功能的影响。方法 选取我院2013年1月-2015年12月收治20例肾衰竭腹膜透析患者,依据透析液钙离子浓度差异分为低钙组(n=10,钙离子浓度1.25 mmol/L)和对照组(n=10,钙离子浓度1.75 mmol/L)。比较两组治疗前后血钙、血磷、尿素氮(BUN)。结果 两组治疗后血钙、血磷下降且低钙组低于对照组;两组治疗后BUN下降且低钙组低于
期刊
近些年来,以黑色素瘤等为例的皮肤癌发病率不断上升,严重危害了人类的生命健康安全。对此类疾病的尽早发现和治疗是提高患者生活质量的重要途径。皮肤镜凭借其无创、简便和能提高检测准确性的优点,在对黑色素瘤等皮肤病变的诊断中得以广泛应用。然而,即使是专业的皮肤科临床医生,在皮肤镜图像上进行人工诊断时也可能发生漏检和错诊的情况。计算机辅助医生进行皮肤镜图像的病变分析,提高皮肤病变诊断的准确率和效率,对于提升患
学位
布尔公式的边缘概率是指所有使布尔逻辑公式可满足的指派中,目标变量赋值为真的概率。获取布尔公式的边缘概率非常有意义,例如,如果我们能对公式中的变量进行准确的随机抽样,那么就可以通过边缘概率推导出模型计数;如果我们能准确计算出公式中所有变量的边缘概率,那么就能快速生成公式的一个可满足的指派。图神经网络是指将图与神经网络结合进行端到端的计算,以便于处理结构化的数据。尽管用于求解布尔公式边缘概率的图神经网
学位
随着互联网技术与人工智能研究的突飞猛进,网络通讯以及智能化系统逐渐步入了人们的日常生活。生活中智能问答,搜索引擎,智能推荐都离不开自然语言处理技术的支撑。自然语言处理技术是人工智能领域的重要研究方向,而其中关系抽取任务是自然语言处理领域的核心问题之一。关系事实以三元组的形式组织世界知识,这些结构化事实充当人类知识的重要角色,并显式地或隐式地隐藏在文本中。从文本中自动化,高效地抽取完整的三元组知识,
学位
目的:比较卵巢储备功能减退(diminished ovarian reserve,DOR)的年轻人群中运用高孕激素状态促排卵(progestin-primed ovarian stimulation,PPOS)方案和促性腺激素释放激素拮抗剂促排卵(gonadotropin-releasing hormone antagonist,GnRH-ant)方案进行IVF/ICSI辅助生殖应用结局,为临床提
学位