基于文献的药物表型实体识别及关系抽取方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zhangyi89521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物医学文本的信息抽取任务得到了越来越多的关注,尤其是对于药物类的,大多关注药物和药物之间相互作用的研究,以期充实知识库,为以后的临床研究和药物研究提供知识储备,但对于药物与表型的关系研究比较少。由于引发一类疾病或是生物个体不适症状的不止是药物,也会有其他疾病和症状。对于这些疾病和症状,医学上称之为并发症、后遗症等,因此,对于这类实体之间关系的研究也是很有必要的。本文中药物实体包括各类药物,表型实体包括了疾病和体征。通过对药物、表型实体及关系的研究,其结果可以帮助从事医学相关的研究人员更好的把握临床治疗过程,及时采取对症措施和药物。本文主要研究了文献类医学文本的命名实体识别和关系抽取任务的实现方法。对于这类信息抽取任务,传统方法是按照命名实体识别、关系抽取、事件抽取的顺序进行。后来有人认为,关系抽取可以独立作为一个任务进行,因而出现了只专注于关系抽取任务的独立模型,以及使用联合模型同时完成实体识别和关系抽取任务的两种做法。本文对这两种方式都进行了尝试。第三章对前一种方式进行了探索,使用目前的主流神经网络方法,对于药物表型实体和抽取的关系分别进行尝试。而第四章则是对后一种方式的尝试,首次采用了多头选择和对抗训练两种方式的联合模型同时对医学文本中的关系和实体进行识别。具体工作内容由以下三部分构成:(1)基于Bi LSTM的药物表型实体识别采用Bi LSTM结合CRF的方法对医学文献进行药物表型实体识别。通过对病历和文献两种形式的医学文本进行识别,测试了两种不同的获得词向量方法对实体识别的影响。模型基于字级别,使用BIO标签策略,将实体名称特征,结合分词特征进行训练。对于不同的数据集,采用不同的输入特征,并对不同特征下的预训练模型效果进行测试。(2)基于注意力机制的关系抽取方法采用在Bi LSTM神经网络上添加注意力机制的方法进行关系抽取。使用CNN获得的词向量,拼接位置特征,在不识别实体的前提下,直接进行关系抽取。(3)多头选择的实体识别和关系抽取联合模型应用一种联合模型对两个信息抽取任务进行训练。该模型的优势在于不需额外的POS标注工具或是其他人工提取特征,同时对实体和关系进行抽取,而不是先进行实体识别,再进行关系抽取,并添加了head信息,并取得了不错的效果。
其他文献
准噶尔盆地金龙2井区火山岩储层为低孔低渗储层,火山岩岩性复杂,岩性识别符合率低,其次储渗模式复杂,无法用简单的线性关系进行描述,因此利用常规解释方法预测火山岩储层质量
学生联合会,作为中国共产党领导下,领导和组织学生群体参与各项政治、文化、社会活动,代表学生表达见解的学生组织,是具有带动性和协调性的。而上海市学生联合会在新中国成立之初的上海也扮演了重要角色。本文主要论述上海市学生联合会在新中国成立之初开展的具体工作:指导上海各学校学生会贯彻落实推进新民主主义教育的方针政策,积极开展新民主主义的学习;团结青年力量,组织和发动上海学生参与学生运动,积极投身于解放后上
电视剧是运用现代电子摄录技术和戏剧表演手段,以视听艺术语言为表达方式的适宜于家庭收看的电视叙事艺术作品。随着文化创意产业的不断发展,电视剧已成为内容产业的支柱之一
钽酸锂(Li Ta O3,以下简称LT)是一种典型的软脆多功能晶体材料,因其独特的物理特性,如压电、热释电、铁电、声光及电光效应,在航空、航天及商用等光电产品领域得到了广泛关注。
氨基脲敏感性胺氧化酶(SSAO/VAP-1)是一种含二价铜的铜胺氧化酶,广泛存在于人体各器官和组织的内皮细胞上。它不仅参与生物源性和异种性的初级胺的代谢,而且还起着粘附分子、白
针对窄带相机拍摄的作物冠层图像,本文开发了一种图像处理算法,可以去除背景干扰,更加真实地获取作物冠层的NDVI值,实际使用时在标准工业RGB相机的镜头上加装窄带滤光片以获
由于通信网络以及分布式控制的快速发展,多智能体系统的一致性研究成为系统与控制领域的研究热点,受到了国内外学者的广泛关注。多智能体系统的一致性是指系统中每个智能体通过通信网络传递信息,使其在位置或者速度等状态量上趋于渐近相同,呈现出行为状态的一致,被广泛的应用于多无人机编队、多卫星角度校正、多传感器网络同步等。由于现实世界中存在噪声、空气阻力等非线性因素,这些因素常常会给多智能体系统的一致性造成一定
在语言学领域,前人多从历史话语和辩证关系视角研究国家形象。然而这些研究鲜有关注受众的认知机制,导致对意识形态再现的解释不足。识解理论作为批评话语分析的认知框架,将重点从语言模式转移至认知,填补了这一空白。因此,从识解角度探索国家形象建构有助于揭示受众解读文本潜在意识形态的过程。本研究基于识解理论,采用定量与定性相结合的方法,分析了20篇习近平主席的外交演讲,以期阐释国家形象构建过程中所使用的语篇策
灰铸铁由于其良好的铸造性能、切削加工性、减振性和耐磨性,被广泛应用于现代机械工业制造中,如机床床身、发动机缸体等,但是因为灰铸铁基体中的片状石墨结构,严重影响了灰铸
党的政治建设是党的根本性建设,决定党的建设方向和效果。习近平总书记在党的十九大报告中,根据新时代党的建设新课题,提出了党的建设新的总要求,特别强调要把党的政治建设摆