【摘 要】
:
随着互联网的迅速普及,生物医学文献的数量日益飞速增长,使得如何从海量的非结构化生物医学文献中获取相关有益知识以便研究人员使用成为一大难题。因此,生物医学信息抽取技术应运而生。而生物医学事件抽取是生物医学信息抽取中的一个重要基础任务,旨在抽取细粒度的生物实体之间的多元语义关系,并将事件的详细信息以结构化形式展示,对药物研发和疾病防治等具有重大意义。本文基于MLEE语料,利用神经网络方法对生物医学事件
论文部分内容阅读
随着互联网的迅速普及,生物医学文献的数量日益飞速增长,使得如何从海量的非结构化生物医学文献中获取相关有益知识以便研究人员使用成为一大难题。因此,生物医学信息抽取技术应运而生。而生物医学事件抽取是生物医学信息抽取中的一个重要基础任务,旨在抽取细粒度的生物实体之间的多元语义关系,并将事件的详细信息以结构化形式展示,对药物研发和疾病防治等具有重大意义。本文基于MLEE语料,利用神经网络方法对生物医学事件抽取展开了实验研究,研究内容主要分以下几个方面:(1)提出基于图卷积网络的生物医学事件触发词识别方法。基于MLEE语料进行实验,通过自然语言处理工具获取词性信息、依存句法信息等,丰富初始特征表示。使用双向长短期记忆神经网络(Bidirectional Long Short Term Memory,Bi LSTM)获取句子上下文表示以及使用图卷积网络(Graph Convolutional Network,GCN)对依存信息进行建模,并利用Softmax函数进行触发词类别分类,从而完成生物医学事件触发词识别任务。实验结果验证了模型的有效性。(2)提出基于组合神经网络的生物医学事件元素检测方法。根据生物医学事件的定义构建候选事件触发词-元素对,使用卷积神经网络(Convolutional Neural Network,CNN)提取局部特征,利用卷积操作较好地学习表示。利用门控循环神经网络(Gate Recurrent Unit,GRU)提取上下文全局特征,进一步进行特征提取。同时引入注意力机制(Attention Mechanism)将局部和全局信息进行融合,对候选对使用Softmax函数进行分类,从而完成元素检测任务。最后,通过规则后处理得到最终的事件。实验结果表明,本文提出的方法能够得到较好的抽取性能。(3)提出基于图注意力网络的生物医学事件联合抽取方法。通过语言模型训练得到词语向量,再结合词性向量、实体类型向量以及位置向量,得到了输入表示。使用Bi LSTM提取上下文特征,丰富单词表示。对语料进行预处理得到依存句法解析等信息,根据依存句法解析得到的句法结构使用图注意力网络(Graph Attention Network,GAT)进行深层次结构特征提取。最后,通过Softmax分类器进行触发词类型分类和元素角色类型分类,完成生物医学事件联合抽取任务。实验结果显示,联合模型一定程度上缓解了级联错误传递,并能获得较好的事件抽取性能。
其他文献
彝族婚姻习惯法直接反映了彝族人民的婚姻生活。它是传统社会文化的组成部分,是彝族文化的重要体现。在实践中,为完善社会主义法治,促进社会积极发展往往需要彝族婚姻习惯法
目的:通过对消风散在皮肤科疾病中应用的临床研究文献进行分析研究及质量评估,探讨陈实功著《外科正宗》经典方“消风散”在近代皮肤科疾病治疗中的具体应用及特点,为临床应用提供依据。方法:通过检索中国知网、万方数据库、维普科技期刊数据库在1999年至2018年这20年间,应用消风散治疗皮肤科疾病的临床研究文献,具体方法为:以“消风散”为检索词进行高级检索,得到应用消风散治疗皮肤科疾病的临床研究文献,根据纳
尾喷管等高温部件的雷达隐身问题是我国先进航空航天器发展的技术瓶颈之一。美欧等国已将雷达隐身碳化硅纤维增强陶瓷基复合材料用于先进战机,对中国严密技术封锁。对SiC纤维进行电磁性能改性是该复合材料具有雷达隐身性能的基础。研究表明,通过对SiC纤维掺杂磁性金属元素可有效提高其介电/磁损耗,有望制备出耐高温、抗氧化、宽频吸波的SiC纤维。传统化学和物理掺杂法引入磁性金属量低,电磁性能弱。本论文发展了一种制
电磁感应透明(EIT)是发生在三能级系统中的一种量子干涉现象,是由发生在不同路径的激发跃迁之间的量子相消干涉引起的。它能够在一个宽的吸收光谱中形成一个窄的透射窗口,使
近年来,因大量使用化学农药造成的污染日益增多,对人们的健康和农作物的生长产生危害。磺酰脲类除草剂是一种超高效除草剂,目前普遍应用于禾谷类作物田防除阔叶杂草和禾本科
当今世界的能源结构正在发生变化,自然环境的破坏问题也日渐严峻,因此,在一些风能、太阳能丰富的地区,可再生能源因其经济性、普遍性、可再生性、无污染性受到了人们的广泛利用。为了充分发挥分布式电源的作用和效益,微电网应运而生,并迅速发展。作为大电网的重要补充,以及分布式发电和电网链接的桥梁,微电网在推动可再生能源发展、助力国家能源转型和电力体制改革,方面担当了日益重要的角色。但是光伏、风力发电受地势、气
随着我国经济的快速发展,高速铁路网不断向西南部山区扩张,我国西南部山区多为岩溶地质,环境条件极其复杂,长大隧道的修建不可避免会穿越各种规模的溶洞,建设难度大。黔张常铁路高山隧道巨型溶洞首次采用“加工洞砟回填+上部注浆”的处置方案,处置后洞内形成超厚回填体,沉降问题显著。本文基于此工程,对溶洞处置前的方案比选及处置后的超厚回填体沉降及其控制技术进行系统研究,该研究为今后类似地区和条件下的岩溶隧道工程
背景:近年来育龄人群的生育力呈现下降趋势,生育力相关研究已成为生殖健康领域的研究热点。中国是世界人口大国,中国育龄人群的生育力一直受到全世界的关注。妊娠等待时间(time to pregnancy,TTP)即夫妇双方在未避孕且规律性生活开始到实现妊娠所经历的时间,是评价生育力的有效指标之一,受到多种因素的影响,包括年龄,初潮年龄(age at menarche,AAM)、月经规律与否、经期长短、月
随着国民电力消费水准的不断提高,对电力服务质量的要求也越来越高。传统的电网发展模式也必须向着智能化、数字化的方向发展,因此,坚强的智能电网成为国家电网发展的重要战
基于偏微分方程的各向异性扩散方法一直是图像去噪领域研究的热点,该类方法利用扩散方程在图像边缘方向扩散弱的特征实现了在去噪时保持图像边缘信息(简称“保边去噪”)的目的,并取得了研究者们的一致认可。在不断的研究中发现,有效信号与噪声的能量比值在全频带的分布是不均匀的,传统的全频带去噪处理方法会存在过度去噪导致边缘信息被平滑的问题。因此,本文主要基于各向异性扩散方法和分频思想进行研究,结合新型的变分模态