论文部分内容阅读
随着联合用药趋势的增长,药物相互作用诱发的药物不良事件成为了临床实践的一大挑战。受限于药物上市前临床试验的时长和样本量,难免发生潜在的药物相互作用未被发现的情况。因此,药物上市后的药物安全监测系统成为研究和发现药物相互作用的一个重要资源和凭仗。自发呈报系统(Spontaneous Reporting System, SRS)和电子健康记录(Electronic Health Record, EHR)是两类重要的药物安全监测系统,含有大规模的药物及药物不良事件信息。面对海量的药物安全监测数据,利用数据挖掘方法从其中检测潜在的药物相互作用是近几年的研究热点。基于SRS和EHR这两类重要的药物安全监测系统,本文研究了药物相互作用的数据挖掘方法。鉴于多种药物相互作用的复杂性,多数方法仅进行了两种药物(药物-药物)相互作用的数据挖掘研究。本文在研究两种药物相互作用数据挖掘方法的同时,进一步研究了多种药物相互作用的数据挖掘方法。本文的主要研究内容如下:
第一,SRS和EHR数据预处理。本文选取SRS和EHR中的常用数据库,分别为FAERS(FDA Adverse Event Reporting System)数据库和EMR(Electronic Medical Record)数据库作为研究所用的数据源。为了提高研究所用数据的质量,本文对FAERS数据库以及EMR数据库中的数据进行了预处理,为后续的研究提供数据基础。对FAERS数据的预处理主要包括去除重复报告,以及药物名和药物不良事件名的规范化。对EMR数据的预处理主要是应用流行病学研究方法获取病例、对照以及相应的药物暴露信息。
第二,针对现有两种药物相互作用数据挖掘方法中缺乏假阳性信号控制的问题,提出了一种用于SRS中药物-药物相互作用数据挖掘的逻辑回归-三组分混合模型(LR-3CMM)。LR-3CMM模型由用于求解药物-药物-不良事件组合基线频率的逻辑回归模型(LR)和用于构建药物-药物-不良事件组合相关风险分布的三组分混合模型(3CMM)构成。LR-3CMM模型可以实现对数据中每个药物组合的局部错误发现率的估计。以局部错误发现率作为药物-药物相互作用的度量标准,降低了结果中的假阳性率。模拟研究表明,LR-3CMM模型在检测两种药物相互作用方面优于现有方法。应用FAERS数据集的实例分析表明,LR-3CMM模型性能良好且检测出多个未被现有方法发现的药物-药物相互作用信号。
第三,针对现有两种药物相互作用数据挖掘方法中缺乏对大规模混杂因素控制的问题,提出了一种用于SRS中药物-药物相互作用数据挖掘的倾向性评分校正的逻辑回归-三组分混合模型(PSLR-3CMM)。当SRS数据中存在大量可观测的混杂因素时,利用倾向性评分方法将所有的混杂因素整合为一个倾向性评分,一次性的处理了数据中所有的混杂因素,为控制大规模的混杂因素提供了解决方法。在PSLR-3CMM模型中,应用倾向性评分对药物-药物-不良事件组合的基线频率进行校正,从而避免了混杂因素对结果的影响。3CMM模型框架则为药物-药物相互作用信号提供了必要的假阳性控制,有效减少了结果中的假阳性信号。模拟研究表明,PSLR-3CMM模型在检测存在混杂因素的数据中的药物-药物相互作用方面具有优越的性能。选取联合用药作为FAERS数据集中的混杂因素,实验结果表明,PSLR-3CMM可以有效解决由联合用药造成的信号遮蔽问题,并且新发现了多个药物-药物相互作用信号。
第四,针对目前用于多种药物相互作用数据挖掘的混合药物数目响应模型(MDRM)中存在的问题,提出了两个新的混合药物数目响应模型,分别为有最大风险阈值的固定概率混合药物数目响应模型(FMDRM-MRT)和有最大风险阈值的数目相关概率混合药物数目响应模型(CMDRM-MRT)。本文提出的两个模型不仅解决了MDRM中基线模型与药物数目响应模型在药物数目为1时不连续的问题,还对最大药物不良事件风险进行了限制。CMDRM-MRT模型进一步研究了模型中混合概率与药物数目之间的关系。为了提高结果的准确性,实验时联合使用了FAERS数据集和EMR数据集。实验结果表明,CMDRM-MRT模型和FMDRM-MRT模型在检测多种药物相互作用信号方面均优于MDRM模型,CMDRM-MRT模型的性能则要优于FMDRM-MRT模型。
第五,针对现有的多种药物相互作用数据挖掘方法中缺乏对混杂因素控制的问题,提出了一种用于EMR中多种药物相互作用数据挖掘的混合条件逻辑回归模型(MCLRM)。EMR数据中的混杂因素会对数据挖掘的结果产生影响。本文采用病例-交叉设计方法处理EMR数据,有效解决了数据中一些无法观测的混杂因素带来的问题。针对病例-交叉设计的特点,提出了一种用于检测多种药物相互作用信号的MCLRM模型,首次实现了对病例-交叉设计中多种药物相互作用的数据挖掘。利用MCLRM模型,估计了每个药物组合的局部错误发现率,实现了对结果中假阳性率的控制。实验结果表明,MCLRM模型在挖掘EMR数据集中的多种药物相互作用信号方面具有良好的性能。
第一,SRS和EHR数据预处理。本文选取SRS和EHR中的常用数据库,分别为FAERS(FDA Adverse Event Reporting System)数据库和EMR(Electronic Medical Record)数据库作为研究所用的数据源。为了提高研究所用数据的质量,本文对FAERS数据库以及EMR数据库中的数据进行了预处理,为后续的研究提供数据基础。对FAERS数据的预处理主要包括去除重复报告,以及药物名和药物不良事件名的规范化。对EMR数据的预处理主要是应用流行病学研究方法获取病例、对照以及相应的药物暴露信息。
第二,针对现有两种药物相互作用数据挖掘方法中缺乏假阳性信号控制的问题,提出了一种用于SRS中药物-药物相互作用数据挖掘的逻辑回归-三组分混合模型(LR-3CMM)。LR-3CMM模型由用于求解药物-药物-不良事件组合基线频率的逻辑回归模型(LR)和用于构建药物-药物-不良事件组合相关风险分布的三组分混合模型(3CMM)构成。LR-3CMM模型可以实现对数据中每个药物组合的局部错误发现率的估计。以局部错误发现率作为药物-药物相互作用的度量标准,降低了结果中的假阳性率。模拟研究表明,LR-3CMM模型在检测两种药物相互作用方面优于现有方法。应用FAERS数据集的实例分析表明,LR-3CMM模型性能良好且检测出多个未被现有方法发现的药物-药物相互作用信号。
第三,针对现有两种药物相互作用数据挖掘方法中缺乏对大规模混杂因素控制的问题,提出了一种用于SRS中药物-药物相互作用数据挖掘的倾向性评分校正的逻辑回归-三组分混合模型(PSLR-3CMM)。当SRS数据中存在大量可观测的混杂因素时,利用倾向性评分方法将所有的混杂因素整合为一个倾向性评分,一次性的处理了数据中所有的混杂因素,为控制大规模的混杂因素提供了解决方法。在PSLR-3CMM模型中,应用倾向性评分对药物-药物-不良事件组合的基线频率进行校正,从而避免了混杂因素对结果的影响。3CMM模型框架则为药物-药物相互作用信号提供了必要的假阳性控制,有效减少了结果中的假阳性信号。模拟研究表明,PSLR-3CMM模型在检测存在混杂因素的数据中的药物-药物相互作用方面具有优越的性能。选取联合用药作为FAERS数据集中的混杂因素,实验结果表明,PSLR-3CMM可以有效解决由联合用药造成的信号遮蔽问题,并且新发现了多个药物-药物相互作用信号。
第四,针对目前用于多种药物相互作用数据挖掘的混合药物数目响应模型(MDRM)中存在的问题,提出了两个新的混合药物数目响应模型,分别为有最大风险阈值的固定概率混合药物数目响应模型(FMDRM-MRT)和有最大风险阈值的数目相关概率混合药物数目响应模型(CMDRM-MRT)。本文提出的两个模型不仅解决了MDRM中基线模型与药物数目响应模型在药物数目为1时不连续的问题,还对最大药物不良事件风险进行了限制。CMDRM-MRT模型进一步研究了模型中混合概率与药物数目之间的关系。为了提高结果的准确性,实验时联合使用了FAERS数据集和EMR数据集。实验结果表明,CMDRM-MRT模型和FMDRM-MRT模型在检测多种药物相互作用信号方面均优于MDRM模型,CMDRM-MRT模型的性能则要优于FMDRM-MRT模型。
第五,针对现有的多种药物相互作用数据挖掘方法中缺乏对混杂因素控制的问题,提出了一种用于EMR中多种药物相互作用数据挖掘的混合条件逻辑回归模型(MCLRM)。EMR数据中的混杂因素会对数据挖掘的结果产生影响。本文采用病例-交叉设计方法处理EMR数据,有效解决了数据中一些无法观测的混杂因素带来的问题。针对病例-交叉设计的特点,提出了一种用于检测多种药物相互作用信号的MCLRM模型,首次实现了对病例-交叉设计中多种药物相互作用的数据挖掘。利用MCLRM模型,估计了每个药物组合的局部错误发现率,实现了对结果中假阳性率的控制。实验结果表明,MCLRM模型在挖掘EMR数据集中的多种药物相互作用信号方面具有良好的性能。