基于深度学习的生物医学实体关系抽取算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:tyh0713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着生物医学技术的进步,生物医学领域产生了大量的研究成果,该领域文献呈急剧增长趋势。截止目前,医学文献搜索引擎PubMed引文已经超过三千万,这些文献中蕴含着丰富的生物医学知识。面对如此海量的文献,科研人员通过人工阅读的方式获取有用信息、了解生物医学领域最新研究进展越来越困难。通过文本挖掘从海量文献中自动挖掘出知识是解决这一困境的可行办法,受到了越来越多研究人员的关注。实体关系抽取技术是文本挖掘领域的关键技术。生物医学文献中存在许多命名实体,这些实体包括蛋白质、药物和疾病等类型。这些命名实体之间存在许多关系例如蛋白质和蛋白质之间的交互关系、药物和疾病之间的治疗关系。通过实体关系抽取技术将这些实体关系从文献中挖掘出来对生物学家进行系统生物学研究有重要意义。当前该技术主要有三类方法:共现法、模板匹配方法和机器学习方法。相较于共现方法的低精确率和模板匹配方法的低召回率,机器学习方法由于出色的性能受到研究人员的广泛关注。基于机器学习的关系抽取方法可分为:基于特征工程的方法、基于核函数的方法和基于深度学习的方法。基于特征工程和基于核函数的方法比较依赖于特征设计,因此,近期的研究热点是使用深度学习这种不依赖特征工程的方法来进行实体关系抽取。由于生物医学语料规模比较小,当前大部分基于深度学习的关系抽取研究都基于其他自然语言处理工具,其中依存句法树是最主要的补充特征。这将使实体抽取性能依赖于这些工具的性能。除此之外,这些工具限制了模型的预测速度。循环神经网络由于极强的序列特征学习能力受到了近期工作的青睐。但是,循环神经网络由于难以并行实现,因此预测速度要慢于卷积神经网络。除此之外,循环神经网络训练也比较困难。因此,基于已有工作的这两个问题,本文提出了一种基于残差卷积神经网络的生物医学实体关系抽取模型,该模型基于卷积神经网络实现并且不依赖其他自然语言处理处理工具。相较于直接堆叠多个卷积模块,通过残差结构可以促进深度神经网络的梯度传播,从而使卷积神经网络可以拥有更深的架构。本文模型在多个生物医学实体关系抽取语料库上进行了测试,相较于已有的工作,本文模型取得了令人满意的效果。
其他文献
就贸易规模而言,国际服务贸易与货物贸易相比还是存在较大差距,但随着全球贸易分工的不断深化和发展,近年来世界各国给予服务贸易发展以高度重视,其增长速度超过货物贸易的增
目的对目前全膝关节置换术(TKA)中常用的2种确定胫骨假体旋转位置的方法进行比较,以期为术中胫骨假体的正确旋转放置提供参考。方法连续行初次单侧TKA手术30例。术中于胫骨截
罗尔斯在其正义理论中将正义作为社会制度的首要美德。然而,共同体主义者(也被称为社群主义者)桑德尔并不认为正义必然优先于仁爱等其他美德。桑德尔针对正义的优先性进行了
电力变压器作为电力系统的核心关键设备,为电网传输交流电能,是远距离输电不可或缺的组成部分,对电网的安全、稳定、可靠运行起着至关重要的作用,也在一定程度上对用户的供电
基于摩擦学和齿轮系统动力学,同时考虑到轮齿摩擦、时变啮合刚度、偏心质量和综合误差的影响,创建了齿轮传动系统六自由度耦合动力学模型.利用自适应及变步长数值仿真方法对
目的采用基于体素的形态学分析(VBM)和基于表面的形态学分析(SBA)相结合的分析方法,探讨成年早期首次发病精神分裂症患者脑皮层改变区域,并寻找与精神症状相关的皮层改变脑区。方
目的在磁共振图像上研究胫骨假体旋转排列的骨性标志。方法对68例正常膝关节行磁共振横断面扫描,在胫骨近端横断面上测量胫骨前后轴与髌腱交点内侧宽度比例(AB%),与股骨外科
文章在实地调研的基础上,阐述了山东省集体林权制度改革的目标、主要内容以及已取得的成效。针对改革中存在的集体林木采伐管理制度、集体林权流转制度、林权证抵押贷款相关
<正>香港大学美术博物馆很荣幸可以展出陈淑霞独特的油画作品精选。作为一个已问道参展逾三十载的艺术家,陈淑霞以其对生活的细致观察及体会,创作了许多颇具主题风格的肖像及
台风是对我国东南沿海威胁最大的自然灾害,据统计台风每年对频发的东南沿海五省市(上海市、浙江省、福建省、广东省、海南省)造成年均直接经济损失约6亿人民币,年均伤亡人数