论文部分内容阅读
药物不良事件作为医疗领域中尚未完全解决的重大问题,造成了高发病率、高死亡率以及巨额医疗费用,对公共健康构成严重威胁。在药物上市前,其所经历的传统毒性试验以及临床试验受样本规模及数据类型等问题的制约,药物上市后会持续进行风险管理。在信息技术的推动下,计算机运算与仿真等技术作为一种高效且低成本的研究方法,在药物不良事件预测以及监测研究中具有十分重要的作用。该类技术随着数据的不断更新,可以持续对信号进行预测以及监测。近年来,通过网络分析方法对数据进行集成与整合来获得模型,研究人员可以利用网络邻近度与大规模患者纵向数据相结合的方式促进药物不良事件研究。尽管基于网络模型的系统药理学预测方法受到许多研究者的关注,但目前尚未研究过药物不良事件关联的频率信息以及样本量是否在预测真正药物不良事件关联中起到重要作用。另一方面,比例失衡方法(Disproportionality analysis,DPA)作为数据挖掘算法之一,广泛应用于自发呈报系统中进行监测研究。DPA方法旨在辨识高度重要的药物不良事件关联,且可以有效衡量关联的定量信息。然而,需要合理地选择比例失衡方法,不同的方法会带来不同的效果。此外,不同监测方法产生的信号也可以相互补充,它们对药理学研究具有十分重要的价值。针对以上现状,本文从计算策略的角度出发,重点对药物不良事件预测以及监测存在的问题进行探索研究,期望获得优越的预测性能以及有效的监测方法,从而尽早且准确地辨识药物不良事件。基于此,对于药物不良事件预测以及监测研究,本文主要围绕以下内容展开:(1)基于比例失衡方法指导药理学网络模型的药物不良事件预测方法研究。药理学网络模型(Pharmacological network model,PNM)利用已知的药物不良事件关联数据预测新的、未知的药物不良事件,PNM方法把观察到的药物不良事件关联均视为真阳性信号,没有考虑药物不良事件关联在数据集中的频率信息以及有效样本量。然而,DPA方法不仅可以估计药物不良事件关联的有效样本量,通过DPA置信区间下限还可以对药物不良事件关联进行信号强度排序。因此,本文从药物不良事件关联在数据集中的频率以及样本量的角度,提出了基于比例失衡方法指导药理学网络模型(Disproportionality analysis guided pharmacological network model,DPA-PNM)的药物不良事件预测方法。不同比例失衡方法具有不同的模式,通过分析不同比例失衡方法(PRR、ROR、IC以及EBGM)与药理学网络模型结合的性能,提出IC-PNM的药物不良事件预测方法。该方法既包含药理学以及网络拓扑结构的相关特征,又引入了药物不良事件关联的频率信息以及样本量,可以有效预测新药的不良事件,提升基于网络模型的系统药理学方法的预测性能。(2)基于特征融合预测网络模型的药物不良事件预测方法研究。药物不良事件预测方法的性能在很大程度上取决于特征,有效反映数据本质属性的特征对预测研究至关重要。与此同时,与特征匹配的机器学习分类器对预测结果也具有关键的作用。因此,本文详细研究复杂网络拓扑结构的链路预测方法,通过网络分析方法与机器学习方法的融合,提出了特征融合预测网络模型(Feature fusion-based predictive network models,FFPNMs)。FFPNMs将网络拓扑结构相似性度量方法引入特征定义,并通过对相似性度量的改进,提取并定义了高效的特征JADF(Jaccard and AA drug fusion,JADF)和JAAF(Jaccard and AA ADE fusion,JAAF)。最后评估不同机器学习算法作为分类器的FFPNMs的性能。实验结果表明,FFPNMs具有优越的预测性能,其中,随机森林作为集成学习分类器获得了最高预测结果,准确率为0.945。FFPNMs没有冗余的特征,降低了数据的维度,且具有良好的鲁棒性,可以有效预测已上市药物的不良事件,提升药物不良事件预测的准确性和稳定性。(3)基于预测网络模型的贝叶斯信号监测算法研究。监测研究依赖于对自发呈报系统等数据源中的历史数据应用统计方法、数据挖掘等方法来提取信号。信息组分法(Information component,IC)作为贝叶斯置信传播神经网络(Bayesian confidence propagation neural network,BCPNN)模型中测量比例失衡的度量,其假设参数服从Beta分布来估计先验概率,并假设超参数值全部为1。然而,特征融合预测网络模型通过逻辑回归可以输出药物不良事件关联的概率。因此,本文联合特征融合预测网络模型与IC算法,提出了一种基于预测网络模型的贝叶斯信号监测算法(ICFFPNM)。ICFFPNM将FFPNM输出的条件概率作为贝叶斯变换后IC算法的先验概率,并通过基于逻辑回归的倾向性评分方法控制混杂因素的影响。与经典的信号监测算法相比,ICFFPNM具有更好的性能,能够有效地减小误差。此外,ICFFPNM也可以与其它信号监测算法相互补充,相较于单独使用一种信号监测算法,结合不同信号监测算法进行监测研究可以获取更高的准确性。