基于神经网络与领域知识的生物医学关系抽取

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:goeas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息抽取技术为处理互联网中存在的海量数据提供了手段。生物医学文献是互联网文本数据的重要组成部分,隐藏在文献背后的知识可以服务于信息检索、推荐系统和问答系统等实际应用领域。关系抽取是用于挖掘文献中蕴含的知识的一种必不可少的技术。本文重点研究生物医学领域的篇章级关系抽取,区别于传统关系抽取局限于抽取单个句子内的实体关系,篇章级关系抽取则是从文献摘要中抽取实体关系,而摘要文本通常由多个句子组成,长度更长,语义更加复杂。本文提出一种基于图卷积神经网络和多头注意力机制的端到端关系抽取方法。为了更好地从长文本中提取特征,构建了文档级别依存图并使用图卷积神经网络对其进行建模,获得了文本的句法结构特征,另一方面使用多头注意力机制从不同的语义子空间中获取与关系抽取任务最相关的文本序列上下文特征,将得到的上下文特征和句法特征融合后用于关系分类。此外,传统的词向量是静态词向量,不能根据上下文确定词的语义表示,而本文使用了深度上下文相关词向量替换传统词向量,解决传统词向量存在的一词多义问题,从而丰富了文本输入特征的表达。除了文本信息以外,现有的生物领域知识也可以为关系抽取提供更多信息。本文提出了基于领域知识的关系抽取方法,探索如何从已有生物知识库中获得领域知识,并将知识信息与文本信息有效结合用于关系分类中。通过现有的生物知识库构建大量的知识三元组,并运用知识表示模型学习三元组中蕴含的领域知识,得到实体向量和关系向量。本文采用关系向量作为知识向量,提出知识注意力机制将领域知识与文本信息进行融合,以进一步提高关系抽取系统的性能。本文的研究是在BioCreative-V组织提出的化学物-疾病关系抽取数据集上展开的。设计并完成了充分的对比实验用于验证所构建模型的实际效果。最终的实验结果显示本文提出的建模方法可以有效地提高关系抽取系统的性能。
其他文献
家庭服务机器人是目前最贴近人类生活的机器人,能够代替或者辅助人完成生活方面的一些事务,逐渐成为家庭中必不可缺的一部分。视觉系统作为机器人的眼睛,已经可以出色地完成
随着中国特色社会主义现代化建设和市场经济的深入发展,进一步缩小城乡之间的发展差距成为现实要求,解决“三农”问题成为中国特色社会主义农业现代化建设艰巨而重要的任务。
自从国家将创新驱动发展确立为国家层面战略开始,创新成为新时期企业间发展的重要环节,作为我国传统的创新载体之一的研发中心,受到众多企业的关注。我们可以清楚的了解到,创
目的:本课题研究不同EGFR基因状态下的肺腺癌围手术期中医证候演变规律,为肺腺癌围手术期的中医治疗提供中医辨证基础,为肺腺癌的中西医结合治疗及其规范化的诊疗体系提供中医方面的理论依据。方法:采用回顾性的临床病例研究方法,设计课题研究的技术路线,严格按照纳入标准和排除标准进行病例选择,将患者的性别、年龄等一般信息及症状体征、舌苔、脉象、肿瘤标记物、病理类型、TNM分期等临床数据详细记录在制定的病例信
六足机器人在危险或灾难环境中运动时,腿部容易发生故障并且无法及时进行人工修复。如果故障机器人可以根据当前情况找到能够让其继续运动的步态,则认为机器人在当前故障情况
正位是大型建筑在营建过程中经过规划、使其带有一定方向性的现象。它萌芽在仰韶文化时期,形成于龙山文化时期,发展于夏商时期。考古发现大量的史前夏商时期建筑遗存,为研究
近年来,随着新型人工智能技术的不断发展以及海量数据的爆炸式增长,如何借助新技术高效、准确地处理并分析不断增长的数据流是一项具有挑战性的任务。现有的深度神经网络通常
为了解决水资源短缺,从喷雾闪蒸海水淡化的机理影响角度提高闪蒸海水淡化的效率,能够有效节约能源提高海水淡化产量,进而实现海水淡化过程高效率低能耗的目的。本文以喷射液
采矿过程中对区域地层的扰动、大型抽放水试验以及长期的矿坑排水等活动会对含水层特征造成不同程度的影响。本文以地下水微动态理论为研究基础,利用井水位固体潮效应反演含水层参数的方法,探讨采矿扰动下煤层上覆含水层参数的变化。研究区位于陕北柠条塔井田南翼,以煤层上覆直罗组裂隙承压含水层为重点研究对象,在对观测孔的监测层位识别的基础上,对地下水位动态数据进行去除长周期趋势和气压效应等,提取井水位固体潮M2波的
互联网经济快速发展的今天,人们每天都在接触各种各样的软件产品,软件给人们在学习、工作和生活等方面带来了巨大的便利。随着软件产品的规模不断变大,功能日益复杂,软件漏洞