基于数据挖掘与网络模型的药物不良事件预测及监测研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:lxy850628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物不良事件作为医疗领域中尚未完全解决的重大问题,造成了高发病率、高死亡率以及巨额医疗费用,对公共健康构成严重威胁。在药物上市前,其所经历的传统毒性试验以及临床试验受样本规模及数据类型等问题的制约,药物上市后会持续进行风险管理。在信息技术的推动下,计算机运算与仿真等技术作为一种高效且低成本的研究方法,在药物不良事件预测以及监测研究中具有十分重要的作用。该类技术随着数据的不断更新,可以持续对信号进行预测以及监测。近年来,通过网络分析方法对数据进行集成与整合来获得模型,研究人员可以利用网络邻近度与大规模患者纵向数据相结合的方式促进药物不良事件研究。尽管基于网络模型的系统药理学预测方法受到许多研究者的关注,但目前尚未研究过药物不良事件关联的频率信息以及样本量是否在预测真正药物不良事件关联中起到重要作用。另一方面,比例失衡方法(Disproportionality analysis,DPA)作为数据挖掘算法之一,广泛应用于自发呈报系统中进行监测研究。DPA方法旨在辨识高度重要的药物不良事件关联,且可以有效衡量关联的定量信息。然而,需要合理地选择比例失衡方法,不同的方法会带来不同的效果。此外,不同监测方法产生的信号也可以相互补充,它们对药理学研究具有十分重要的价值。针对以上现状,本文从计算策略的角度出发,重点对药物不良事件预测以及监测存在的问题进行探索研究,期望获得优越的预测性能以及有效的监测方法,从而尽早且准确地辨识药物不良事件。基于此,对于药物不良事件预测以及监测研究,本文主要围绕以下内容展开:(1)基于比例失衡方法指导药理学网络模型的药物不良事件预测方法研究。药理学网络模型(Pharmacological network model,PNM)利用已知的药物不良事件关联数据预测新的、未知的药物不良事件,PNM方法把观察到的药物不良事件关联均视为真阳性信号,没有考虑药物不良事件关联在数据集中的频率信息以及有效样本量。然而,DPA方法不仅可以估计药物不良事件关联的有效样本量,通过DPA置信区间下限还可以对药物不良事件关联进行信号强度排序。因此,本文从药物不良事件关联在数据集中的频率以及样本量的角度,提出了基于比例失衡方法指导药理学网络模型(Disproportionality analysis guided pharmacological network model,DPA-PNM)的药物不良事件预测方法。不同比例失衡方法具有不同的模式,通过分析不同比例失衡方法(PRR、ROR、IC以及EBGM)与药理学网络模型结合的性能,提出IC-PNM的药物不良事件预测方法。该方法既包含药理学以及网络拓扑结构的相关特征,又引入了药物不良事件关联的频率信息以及样本量,可以有效预测新药的不良事件,提升基于网络模型的系统药理学方法的预测性能。(2)基于特征融合预测网络模型的药物不良事件预测方法研究。药物不良事件预测方法的性能在很大程度上取决于特征,有效反映数据本质属性的特征对预测研究至关重要。与此同时,与特征匹配的机器学习分类器对预测结果也具有关键的作用。因此,本文详细研究复杂网络拓扑结构的链路预测方法,通过网络分析方法与机器学习方法的融合,提出了特征融合预测网络模型(Feature fusion-based predictive network models,FFPNMs)。FFPNMs将网络拓扑结构相似性度量方法引入特征定义,并通过对相似性度量的改进,提取并定义了高效的特征JADF(Jaccard and AA drug fusion,JADF)和JAAF(Jaccard and AA ADE fusion,JAAF)。最后评估不同机器学习算法作为分类器的FFPNMs的性能。实验结果表明,FFPNMs具有优越的预测性能,其中,随机森林作为集成学习分类器获得了最高预测结果,准确率为0.945。FFPNMs没有冗余的特征,降低了数据的维度,且具有良好的鲁棒性,可以有效预测已上市药物的不良事件,提升药物不良事件预测的准确性和稳定性。(3)基于预测网络模型的贝叶斯信号监测算法研究。监测研究依赖于对自发呈报系统等数据源中的历史数据应用统计方法、数据挖掘等方法来提取信号。信息组分法(Information component,IC)作为贝叶斯置信传播神经网络(Bayesian confidence propagation neural network,BCPNN)模型中测量比例失衡的度量,其假设参数服从Beta分布来估计先验概率,并假设超参数值全部为1。然而,特征融合预测网络模型通过逻辑回归可以输出药物不良事件关联的概率。因此,本文联合特征融合预测网络模型与IC算法,提出了一种基于预测网络模型的贝叶斯信号监测算法(ICFFPNM)。ICFFPNM将FFPNM输出的条件概率作为贝叶斯变换后IC算法的先验概率,并通过基于逻辑回归的倾向性评分方法控制混杂因素的影响。与经典的信号监测算法相比,ICFFPNM具有更好的性能,能够有效地减小误差。此外,ICFFPNM也可以与其它信号监测算法相互补充,相较于单独使用一种信号监测算法,结合不同信号监测算法进行监测研究可以获取更高的准确性。
其他文献
钨是元素周期表第VI副族过渡金属元素,广泛存在于地壳岩石和天然水体中。钨具有优良的金属性,长久以来被认为是一种无毒无害的元素而用作铅等有毒重金属的替代品,因而在现代工业生产和军事领域应用广泛。直至最近20年,涉钨健康安全事件的相继披露使钨的毒理性及其健康和环境效应成为研究热点。当前,环境中钨的来源研究集中于地下水系统中含钨矿物的溶解、火山活动、干旱碱性湖泊的蒸发浓缩等天然过程,但来源于地热系统的钨
我国是一个地质灾害多发的国家。在众多地质灾害中,尤以滑坡灾害的占比最大,它们具有规模大、机制复杂、危害性严重等明显特点,在世界范围内具有代表性。受雨季强降水以及库水位周期性变动的影响,我国三峡库区成为了滑坡灾害集中发育的地区,给当地人民生命和财产安全造成了巨大威胁。因此,进行区域滑坡危险性评价对于库区防灾减灾工作十分必要。同时,在全球环境快速变化的今天,滑坡活动受到多种动态因素影响,最明显的就是土
社区环境对教育结果的影响一直是邻里效应研究的重要议题。本文利用中国家庭追踪调查(CFPS)2010年和2014年的少儿样本(6-16周岁)在中国的社会情境中评估了社区环境对中国城市儿童学业成就的影响,具体研究了以下四个问题:(1)社区环境对中国城市儿童学业成就的影响及其作用程度;(2)社区环境对中国城市儿童学业成就的影响在不同类型的社区、不同的生命时期以及不同群体之间的差异;(3)社区环境影响中国
目的:通过循证医学研究方法评价养心汤及养心颗粒治疗冠心病心绞痛的疗效性及安全性;采用代谢组学方法研究慢性稳定性心绞痛(气血亏虚型)的代谢模式及养心颗粒干预慢性稳定性心绞痛(气血亏虚型)的代谢途径,探讨慢性稳定性心绞痛(气血亏虚型)的证候实质及养心颗粒干预慢性稳定性心绞痛(气血亏虚型)的作用机制。方法:1.网络检索The Cochrane Library循证医学库、PubMed、中国生物医学文献数据
[目的]探索肝硬化轻微型肝性脑病(Minimal Hepatic Encephalopathy,MHE)患者中医证候分布特点,同时对肝硬化患者MHE患病情况及相关影响因素进行调查。[方法]在全国12家协作单位纳入门诊或住院的肝硬化患者,并同期纳入健康受试者作为正常对照组。(1)基于正常对照组数字连接试验A(Number Connection Test A,NCT-A)和数字符号试验(Digital
岩石圈挠曲是岩石圈对地质时间尺度内(>10~5 yr)载荷响应的基本方式,基于岩石圈挠曲的研究成功地解释了前陆盆地的成因、海山及俯冲板块的几何构型以及大陆因冰川消融或湖水卸载发生回弹等诸多地质现象;同时,也表明岩石圈挠曲的幅度和空间尺度受控于其强度(或有效弹性厚度),具有广泛的地质与地球动力学意义。研究大陆岩石圈强度及其控制的挠曲过程有助于我们认识大陆岩石圈构造演化的动力学机制,和深部地幔动力过程
背景:慢性萎缩性胃炎(chronic atrophic gastritis,CAG)在我国发病率逐渐低龄化,成为目前公认的难治性疾病之一,并且属于胃癌的前期疾病,如果不加以控制,将会发展为胃癌。西医治疗CAG并没有明确的特效药,常为对症治疗缓解症状。中医药治疗CAG疗效较好,因此开展中医药对CAG的防治具有重要的临床意义。本课题组前期预实验研究发现CAG大鼠模型中Shh的表达下调,益气活血代表药黄
辽东地区古元古代沉积变质型硼矿床是我国硼矿石的主产地,呈层状或透镜状赋存于古元古代辽吉裂谷的火山-沉积建造之中,主矿区包括后仙峪、翁泉沟和砖庙-杨木杆三处,硼矿石类型包括遂安石-硼镁石型和硼镁铁矿-硼镁石型,属于沉积-变质型矿床。矿体直接容矿围岩为蛇纹石化大理岩和蛇纹石化超基性火山岩,外围为各类变粒岩和浅粒岩,矿体和围岩中发育有大量电气石、石膏、黄铁矿等脉石矿物。矿床成因有非海相蒸发沉积、热水沉积
慢性阻塞性肺病(Chronic obstructive pulmonary disease,COPD)是一种持续性的气流受限,并伴随着由于有毒颗粒或气体引起的气道与肺中慢性炎症的疾病。COPD现成为全球死亡率和发病率的一个重要原因,预计到2020年,COPD将在中国疾病负担中排名第一。COPD患者的呼吸道及肺部炎症是呼吸道对刺激物的炎症反应,具体机制尚不明确。目前研究表明,COPD重要的致病机制之
杂种优势是生物界的普遍现象,是改良作物、大幅度提高产量的重要途径。番茄(Solanum lycopersicum)为自花型繁殖的植物,具有非常明显的杂种优势,其不仅具有增加产量的优势,而且具有生长势旺、适应性强、整齐度高和抗逆性强等优势。目前番茄雄性不育系在利用上尚存在一定困难,生产上大面积推广的杂交种,仍然以人工去雄为主,制种成本过高已成为番茄杂种优势利用的主要限制因素之一。在番茄中少数几个控制