基于文本挖掘的药物不良反应研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:wenge228394
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物不良反应是指在符合药品的正常用法及用量的情况下,出现的与用药目的无关的有害反应,对它的深入理解对于确保患者健康安全至关重要。由于传统的上市后药物不良反应监控方法存在报告不足、数据不完整以及报告延迟的问题,因此许多潜在有害药物仍然未被标记。随着大量生物医学文本和社交媒体数据的涌现,利用文本挖掘技术从自然语言文本中自动、准确地获取药物不良反应相关信息,将对生物医学领域的研究产生极大的推动作用。近年来,基于神经网络的深度学习方法已被广泛应用于语音、图像和文本处理研究中,并取得了突破性进展。为此,本文围绕基于深度学习方法的文本挖掘关键技术,从药物不良反应检测、药物不良反应提及识别和药物不良反应关系抽取三个任务开展研究,并根据研究方法构建药物不良反应信息抽取系统ADRExtractor。ADRExtractor能够从海量的无结构化文本中找出与药物不良反应相关的文本,进而识别其中的药物不良反应提及,最后抽取出药物与其不良反应之间的对应关系。
  对于药物不良反应检测任务,针对在小规模的药物不良反应训练数据上神经网络方法无法充分发挥其优势的问题,提出了一种基于对抗迁移学习的药物不良反应检测方法。该方法将药物不良反应检测问题看作一个文本分类任务,并采用迁移学习思想利用大规模源语料集和小规模目标语料集共同训练共享神经网络模块。另外,在训练过程中,引入对抗学习方法防止不同领域语料中的独有特征进入共享模块并影响分类结果。实验结果表明该方法能够有效捕获源语料集和目标语料集之间的共性特征,从而提升模型在小规模语料集上药物不良反应检测任务的性能。
  对于药物不良反应提及识别任务,针对提及边界识别不准的问题,提出一种基于交互图网络的药物不良反应提及识别方法。该方法中通过设计三个单词-短语交互图来直接表示候选短语的边界信息和上下文信息,从而引入词汇知识,并利用图注意力网络对三个交互图进行表示。此外,除了词典中涉及到的药物不良反应提及之外,模型还关注句子中的名词性短语,从而识别出词典外提及,并提升了模型的召回率。实验结果表明,三个单词-短语交互图能够独立地获取不同的信息,并且三个交互图获取的信息之间有效互补。与目前先进方法相比,该方法获得更好的结果,在有效识别出药物不良反应提及的边界,提升提及识别的准确性的同时,通过加入名词性短语使其能够召回更多药物不良反应提及。
  对于药物不良反应关系抽取任务,针对长度过长、实体过多的复杂句式,提出一种基于最短依存路径的神经网络方法。除了原始句子序列之外,该方法引入最短依存路径信息和依存关系类型信息,能够更准确的捕捉实体之间的句法信息。实验结果表明该方法能够有效提升句子级别关系抽取性能,尤其是训练实例数目有限的关系类型。另一方面,针对文档级别关系抽取问题提出一种基于序列标注的文档级别关系抽取方法。不同于传统分类方法,该方法将文档级别关系抽取问题看作一个序列标注任务,以摘要为单位进行输入,并学习同一药物的不同不良反应之间的语义表达,从而同时抽取句内和句间的药物致病关系。实验结果表明,该方法能够准确地抽取出文档级别关系,尤其是句间关系。
  最终,结合三个研究任务所用到的方法,构建了一个药物不良反应信息抽取系统,ADRExtractor。该系统能够从输入的自然语言文本中识别出药物不良反应提及以及药物和不良反应之间的对应关系,并将实体及其关系进行可视化输出。
其他文献
设计应用如此广泛,其作用如此重要,但是,目前对设计的研究,多数研究都是站在一个狭窄的研究领域,认为“设计”就是造物之前的一个阶段,以后进入到生产和流通以至消费环节,主要是技术在发挥作用,都与设计毫无关系。这种对“设计”的狭窄化的理解,影响了设计的实践。因此,本研究致力于超越这种对“设计”的狭义的理解,以设计哲学为视角,将产品设计看作是一个动态的全生命周期展现的过程,从设计是产品的灵魂、是贯穿产品设
学位
作为一种新型的热固性树脂,苯并噁嗪树脂因其优异的性能而备受关注。然而苯并噁嗪同样面临许多亟待解决的问题,如取代基对苯并噁嗪单体的固化行为及对聚苯并噁嗪氢键体系的影响通常被割裂地进行研究,缺乏有机且统一的认识,而涉及杂原子取代基同时对苯并噁嗪树脂的固化行为及氢键体系的影响研究则更是未见报道,此外,苯并噁嗪树脂还面临着应用领域较小的困境。进入21世纪以来,随着工业的不断发展,不可再生的石化资源被大量地
学位
微细矿物颗粒表面水化是造成选矿废水难处理的重要原因之一,在高泥化煤泥水处理过程中体现的尤为明显。高泥化煤泥水中含有大量的微细石英及黏土矿物颗粒,这些颗粒表面电负性强,且表面亲水易形成水化膜影响颗粒的凝聚及分散状态,从而给高泥化煤泥水处理带来极大困难。煤泥水中的金属离子与水分子形成水合阳离子并与矿物颗粒作用而影响其表面水化特性。而目前对离子在石英表面形成水合阳离子并发生吸附的微观机理尚不清楚。为深度
学位
当前及未来相当长时间内,煤炭依然是我国主要的一次消费能源,煤矿硬岩巷道掘进的主要施工方法依然是钻爆法。实现硬岩巷道安全高效爆破掘进的根本有效途径是提高炸药威力以及提高爆炸能量利用率。本文针对有瓦斯爆炸危险的硬岩巷道掘进,研制了含KCl、NH4Cl复合消焰剂的安全高威力水胶炸药,并对炸药性能进行了测试和评价。分析了炸药由凝聚态到气态爆轰产物再到对介质做功的能量转换过程,推导了能量(功率)的传递效率。
学位
铜尾矿是典型工业固体废弃物,由于综合利用水平有限,大量铜尾矿堆积带来的重金属污染和安全问题备受关注,对其进行生态修复具有十分重要的现实意义。植被重建技术在尾矿生态修复中广受青睐,其关键点是基质改良和耐性物种选择。目前,将废弃物制成改良剂修复尾矿是一种重要的修复方法。煤矸石是煤炭开采过程中产生的固体废弃物,可作为贫瘠和盐碱地土壤改良剂,且具有作为重金属吸附材料的潜力。因此,本研究将废弃物煤矸石作为改
学位
本论文分别以铌基纳米片和纳米管为基本结构单元,基于铌基基体材料的结构组成与形貌特征,将它们分别与不同的金属组分进行负载和掺杂,合成系列基于铌基纳米片和纳米管的新型纳米功能复合材料,研究负载和掺杂对铌基纳米片和纳米管物化性质的影响,并将它们应用于能源和环境领域中有机污染物的脱除,考察复合材料的性质与性能之间的构效关系。主要研究内容概括如下:(1)以铌基纳米片HTiNbO5和HNbWO6为基本结构单元
学位
粉煤气化工艺技术因具有强的煤种适应性、高的碳转化率和低的运行成本等优点成为煤气化领域主流工艺之一,在气化过程中不可避免地产生副产物细渣,低的利用率及高的残炭含量既引起环境问题,也造成资源浪费。基于此,本文以不同粉煤气化工艺细渣为主要研究对象,通过XPS、SEM-EDX及XRD等一系列现代分析技术,以入炉粉煤为参照,在研究细渣微观结构、不同结构的化学组成及主要组成元素在不同结构中分布的基础上,通过筛
学位
抗菌活性成分可被添加于诸多消毒清洁产品中。但缺乏对消毒清洁类产品的正确使用,可导致抗菌活性成分通过直接或间接方式对动植物产生毒害作用。随着此类产品使用量的逐年递增,尤其在新型冠状病毒(COVID-19)传播期间,已逐渐显现出对环境的消极影响。目前,已有部分抗菌活性成分被视为潜在的内分泌干扰物,由此可见,抗菌活性成分给环境和人类健康已构成威胁。抗菌活性成分可通过生活污水、医疗废水和工业排污等多种途径
学位
随着风力发电、电动汽车、个人消费类产品以及智能制造领域对高性能永磁体需求的增加,烧结钕铁硼永磁材料受到更多的关注。经过三十多年的技术发展,烧结钕铁硼的最高的磁能积已经逼近其理论极限,近乎完美。材料目前所面对的挑战主要在于满足一些更为严苛的使役环境。一方面,如永磁电机等设备要求磁体具有更高的室温矫顽力以抵抗高温下的退磁效应。目前增强矫顽力最高效的手段是晶界扩散,通过该过程,重稀土元素进入晶粒表层形成
学位
癌症近年来已成为威胁人类健康的重点疾病,乳腺癌则是中国女性患病率最高的癌症类型之一,严重威胁女性健康。传统的手术,放射治疗和化疗手段对于深层肿瘤与转移瘤治疗能力有限,且副作用较重,急需安全高效的治疗方法。靶向治疗属于新型治疗方式,是随着分子生物学技术水平的不断上升而得以诞生的治疗方法,通过选择在肿瘤细胞中高表达,而正常组织中低表达的一种蛋白分子或一个基因片段作为靶点,设计与靶点特异性结合的药物,使
学位