生物医学命名实体识别及关系提取的研究与系统构建

来源 :内蒙古农业大学 | 被引量 : 0次 | 上传用户:liulaolv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物医学文献数量巨大,并且每天仍以极快的速度增长。在同行评审的期刊上平均每天有3000篇新的文章发表,截至2019年,仅Pubmed就有2900万篇文章。包含有关新发现和新见解的有价值信息报告将不断添加到本已大量的文献中。因此,越来越需要用于从文献中提取信息的精确的生物医学文本挖掘工具。生物医学命名实体数量巨大,命名规则不统一,实体构词复杂,给生物医学命名实体识别带来了很大的困难。传统机器学习算法对人工特征提取依赖很大,特征提取的好坏直接影响到实体识别的准确率。而在生物医学领域,人工提取特征以及标注数据集的成本都是非常巨大的。近年来,不依赖于人工特征的深度学习方法在许多领域都取得了很大的进步。本文提出一种Glove-字符级BLSTM-BLSTM-CRF的模型对生物医学命名实体进行识别。首先利用Glove模型训练单词具有语义特征的词向量,用BLSTM训练单词具有字符形态特征的词向量,两者结合作为单词的最终表示,输入BLSTM-CRF深度学习模型,对实体类别进行识别。实验结果表明,在不依赖任何人工特征及规则的前提下,该模型在JNLPBA2004生物医学命名实体识别任务中取得了较好的结果,F1值达到75.62%。本文引用Kindred关系提取库,在Biocreative Ⅱ和Biocreative V两个数据集上训练出蛋白质相互作用关系提取模型以及化合物和疾病关系提取模型。基于Django搭建生物医学文本挖掘系统,将前两个模型嵌入到系统当中为用户提供文献挖掘服务。
其他文献
在高压输电线、飞机、高铁等强电磁干扰的特殊场景下,传统无线通信会受到极大限制,而可见光通信作为一种新的通信技术,因特殊的传输方式,使其可在强干扰场景下代替传统的无线
转向架作为列车运行时至关重要的零部件,其可靠性直接影响列车运行安全。传统的转向架构架损伤检测方法一般采用磁粉探伤检测,只能检测到已有的静态裂纹。而声发射作为一种动态检测技术,能够实时监测结构内部的损伤演变过程。但是运用声发射技术对转向架构架进行损伤检测,目前在铁路现场检测上还处于空白,并且利用声发射技术检测构架损伤缺乏理论研究。本论文围绕转向架构架声发射技术开展了相关研究,包括板状结构声发射波的传
中间球海胆(Strongylocentrotus intermedius)隶属于棘皮动物门、海胆纲、正形目、球海胆科,主要分布在浅海区的岩礁、沙石和砾石海底。中间球海胆是一种在潮间带和浅海底栖群落调控上具有重要生态意义的海洋无脊椎动物。先前研究发现UV-B辐射对中间球海胆行为有较大影响,这说明中间球海胆对UV-B辐射具有一定的敏感性。另外,中间球海胆有大量可检测的适合度相关性状和感光相关基因。因此
错误记忆是指个体对某一事件的记忆与事实之间存在明显差异,将未学习的材料或未发生的事件误认为已学习或已发生的记忆。来源记忆是人们对事件发生的时间空间地点、感知觉特性、环境信息等相关背景信息的记忆。根据来源监测理论,人们在回忆信息时,并不是直接提取来源记忆,而是将激活的记忆痕迹归于特定的来源。因此,可以通过提高来源监测以减少错误记忆的发生。由此可见,错误记忆与来源记忆有着密切的关系。本研究从来源记忆入
完善的图纸资料是古建筑加固、修缮及改造的关键,大批建筑文物因图纸缺失导致其现存资料无法满足建筑修缮的要求。传统的测绘方法效率较低且在测量过程中容易对建筑造成二次
试验于2017年夏玉米生长季在国家粮食丰产科技工程辛集实验站(简称“辛集”)、深州实验站(简称“深州”)以及国家粮食丰产科技工程河北项目区辐射县—成安(简称“成安”)进行
随着人工智能的高速发展和普及,语音识别给人们带来了越来越多的便利,各种各样的智能音响、语音助手、语音输入法等应用随处可见,人们对语音识别的要求也逐渐提高,主要体现在
半导体纳米晶是通过胶体化学方法得以合成,其典型的尺寸一般为1-20 nm,通常由100-10000个原子构成。由于尺寸小于或接近材料的波尔半径,半导体纳米晶属于量子受限材料体系,具
我国是一个水果生产大国,同时也是水果进口大国。水果进口量的持续增加,同时也导致了粉蚧类有害生物入侵几率的增高,其中以南洋臀纹粉蚧风险最高,对我国水果的进出口贸易和农林业生产安全带来严重威胁。为建立有效、快速、环保的口岸检疫处理技术,本文建立了南洋臀纹粉蚧试验种群,测试了粉蚧不同虫态对熏蒸剂气态磷化氢的耐受能力和最耐受虫态雌成虫的毒力效果,测定了磷化氢对南洋臀纹粉蚧寄主水果火龙果的品质和磷化氢残留代
钢管混凝土劲性骨架拱桥在我国公路、铁路桥梁中的应用日益广泛,且该类桥型跨径通常超过300m以上,其抗震设计在现行规范中没有明确规定,需要针对实际桥梁,开展针对性的个体研究。防屈曲支撑作为一种新型减震装置,在房屋建筑结构减震设计中应用较多,在桥梁结构减震设计中应用较少。本文旨在研究防屈曲支撑对大跨度钢管混凝土劲性骨架拱桥在地震作用下的减震效果,得出合理的减震设计方案。本文进行的主要研究工作如下:1、