【摘 要】
:
从大量的生物医学电子文本中自动抽取其中实体之间的关系,对生物医学应用例如生物医学知识图谱的构建,生物医学知识发现等等具有十分重要的意义。随着深度学习、自然语言处理技术的发展,关系自动抽取技术也取得了长足的进步。然而生物医学文本中存在的专业性词汇,实体在句子中的较大跨度,以及句子中混杂的大量无用信息,仍为医学关系抽取带来重大挑战。本文从结合文本序列信息和句法依赖信息的角度出发,通过借助句法结构信息来
论文部分内容阅读
从大量的生物医学电子文本中自动抽取其中实体之间的关系,对生物医学应用例如生物医学知识图谱的构建,生物医学知识发现等等具有十分重要的意义。随着深度学习、自然语言处理技术的发展,关系自动抽取技术也取得了长足的进步。然而生物医学文本中存在的专业性词汇,实体在句子中的较大跨度,以及句子中混杂的大量无用信息,仍为医学关系抽取带来重大挑战。本文从结合文本序列信息和句法依赖信息的角度出发,通过借助句法结构信息来帮助模型更好地理解生物医学文本,提升实体关系抽取效果。首先本文采用GCN模型建模句法图结构,并对GCN方法进行改进,将以往用于通用领域关系抽取的GCN模型迁移到生物医学数据上,提出改进的Multi-head GCN网络结构,再根据生物医学数据特点设计了基于根节点的句法信息提取方法。在三个生物医学数据集CPR,DDI,GAD上的实验说明了对GCN方法改进的有效性,且改进方法能够优于其他大多数深度神经网络结构。本文还对基于预训练模型的关系抽取方法进行改进,提出了融合句法依赖信息的预训练模型方法,主要对预处理层、特征结构层、模型结构层三大部分进行优化。首先在生物医学文本预处理中采取实体屏蔽,医学缩写替换,句法依赖结构变换操作,并提出了结合卡方检验关键词的句法信息提取方法。然后在特征提取中采用了实体上下文信息和句法信息的组合特征。在模型结构层,设计了融合句法信息的Transformer编码器结构,并将其嵌入到Pub Med BERT预训练模型中。最后。实验结果验证了各部分优化的合理性和有效性,证明了本文方法能够在多个医学关系抽取数据集上取得当前基于预训练模型方法的最优效果。
其他文献
压电智能骨料是目前用于混凝土结构健康监测中常用的传感器,可进行动态应力及材料性能的超声监测。压电智能骨料嵌入结构时往往需要通过粘结或绑扎方式固定到钢筋等支撑结构上,支撑结构干扰监测区域应力场且传感器位置稳定性较差,由此影响监测精度。本文提出一种新型的压电智能骨料嵌入方法——预制块嵌入法(Concrete Block Casing,CBC)。通过数值及试验研究发现,与传统嵌入方法相比新型嵌入方法显著
刺激隐核虫(Cryptocaryon Irritans)是严重危害东南亚海水养殖鱼类的寄生虫病原。MAPK与MHC Ⅱ抗原提呈通路是宿主免疫激活及特异性免疫起始的重要通路,在该寄生虫介导的鱼类相关通路应答机制还不清晰。本论文以石斑鱼为研究对象,对刺激隐核虫感染石斑鱼后的MAPK经典通路中的重要分子MEK及C-Raf,以及其通路与MHC Ⅱ信号通路相关性进行了研究。MEK双特异性蛋白激酶是一类丝裂原
显著性目标检测任务旨在将图像中最具有视觉差异性的区域定位和分割出来。它被广泛应用于其他复杂的计算机视觉任务的预处理,如图像编辑、图像描述以及问题回答等,以简化这些视觉任务,提高任务处理的效率。近年来,得益于全卷积神经网络的飞速发展,显著性目标检测的研究者们做了大量的工作,极大地提升了显著性目标检测的性能。然而在显著性目标的尺度、形状多变以及背景环境复杂的场景中,现有的算法无法捕捉到变化目标的信息,
世界城市化建设的浪潮和人类过度活动的冲击是导致生态系统稳定性下降的重要原因,也威胁着世界的自然与文化遗产的保护与传承。国际社会逐渐认识到这种发展并非长久之计,提出可持续发展目标,并在近年开始倡导自然与文化协同发展。我国“十二五”规划提出生态文明建设,当前逐步落实国土空间规划,坚定走中国特色可持续发展道路。可持续发展目标不仅对生态系统自然环境的健康维持提出要求,也对文化遗产保护和文化空间建设提出新的
传统改性沥青的成本增加、制备工艺复杂、相容性差、储存稳定性差,促使人们在不影响改性沥青性能的前提下,开发环保、可再生、经济的改性沥青。为了克服常规改性粘合剂的上述缺点,引入用于柔性路面的改性粘合剂的替代来源是必不可少的。近年来,木质素作为一种沥青改性剂,因其来源广泛、价格低廉、可再生性好、具有提高沥青路面使用性能的潜力而受到越来越多的关注。然而,现有研究缺乏对不同类型木质素改性沥青的性能、储存稳定
网格模型与点云模型是三维模型的两种重要表示方式。为了使三维模型呈现的真实感更加强烈,网格模型与点云模型的精细程度变得越来越高。这给数据加载和模型渲染带来了巨大的挑战性。为了减少加载和渲染三维模型的时间开销,合理的解决方案是通过减少原始网格模型中的面数或点云模型的点数来对三维模型进行数据的精简。许多研究者提出了保持三维模型几何形状特征的简化算法并取得了成功的效果。然而三维模型的颜色和纹理特征在模型的
醇醚羧酸盐(AEC)是一类新型阴离子表面活性剂,毒性小、易生物降解、表面张力低及与其他表面活性剂配伍性好等特点,是一类多功能的绿色表面活性剂。我国对AEC的研究已有十多年,主要工艺路线为氯乙酸钠与脂肪醇聚氧乙烯醚反应制备AEC。但由于氯乙酸钠羧甲基化法的产品质量不高,限制了产品的应用推广。与传统工艺相比,贵金属催化氧化法具有工艺流程短、对设备要求低、可用于连续化生产并可制成高纯度产品等优点,因此引
神经元电活动蕴含着丰富的神经信息.因此对神经元的放电节律的研究更有助于理解神经信息的编码和表达.内分泌神经元控制体内各种激素的分泌,对个体的生长、发育以及身体机能的调控起着至关重要的作用.本研究以三维的内分泌模型为基础,结合动力系统分岔理论,通过数值模拟与理论分析探究该模型固有的动力学性质以及在电磁感应下神经元产生的分岔与放电模式.本文第三章研究了钙离子电流变化下内分泌神经元产生的放电模式.利用快
人体外形重建在许多场景中都扮演着必要的角色,例如在虚拟现实游戏、电影特效、产品定制、增强现实等许多应用中都少不了人体外形重建。图像和视频是信息传递的主要载体,因此如何从图像和视频中获得人体姿态一直是计算机视觉的研究热点之一。当前大多数研究工作都试图采用回归人体参数模型,从而产生与图像和视频中人体一致的姿态。然而,这些方法存在以下问题:人体参数模型无法显示,诸如头发、面部表情、衣服的细节等;因为从高
纤维增强复合材料(Fiber-Reinforced-Polymer,简称FRP)是一种新型材料,具有轻质、高强、耐腐蚀的优点,目前已广泛用于实际工程中。FRP-混凝土-钢双壁空心构件是一种新型组合构件。该新型组合结构中,内部填充的混凝土受到FRP外管和钢内管的约束作用,相比未约束混凝土具有更高的受压强度及更好的变形能力;钢管由于同时受到外侧混凝土及FRP管的约束,能有效避免向外屈曲,能充分利用其强