基于SRS和EHR的药物相互作用数据挖掘方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xinghun124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着联合用药趋势的增长,药物相互作用诱发的药物不良事件成为了临床实践的一大挑战。受限于药物上市前临床试验的时长和样本量,难免发生潜在的药物相互作用未被发现的情况。因此,药物上市后的药物安全监测系统成为研究和发现药物相互作用的一个重要资源和凭仗。自发呈报系统(Spontaneous Reporting System, SRS)和电子健康记录(Electronic Health Record, EHR)是两类重要的药物安全监测系统,含有大规模的药物及药物不良事件信息。面对海量的药物安全监测数据,利用数据挖掘方法从其中检测潜在的药物相互作用是近几年的研究热点。基于SRS和EHR这两类重要的药物安全监测系统,本文研究了药物相互作用的数据挖掘方法。鉴于多种药物相互作用的复杂性,多数方法仅进行了两种药物(药物-药物)相互作用的数据挖掘研究。本文在研究两种药物相互作用数据挖掘方法的同时,进一步研究了多种药物相互作用的数据挖掘方法。本文的主要研究内容如下:
  第一,SRS和EHR数据预处理。本文选取SRS和EHR中的常用数据库,分别为FAERS(FDA Adverse Event Reporting System)数据库和EMR(Electronic Medical Record)数据库作为研究所用的数据源。为了提高研究所用数据的质量,本文对FAERS数据库以及EMR数据库中的数据进行了预处理,为后续的研究提供数据基础。对FAERS数据的预处理主要包括去除重复报告,以及药物名和药物不良事件名的规范化。对EMR数据的预处理主要是应用流行病学研究方法获取病例、对照以及相应的药物暴露信息。
  第二,针对现有两种药物相互作用数据挖掘方法中缺乏假阳性信号控制的问题,提出了一种用于SRS中药物-药物相互作用数据挖掘的逻辑回归-三组分混合模型(LR-3CMM)。LR-3CMM模型由用于求解药物-药物-不良事件组合基线频率的逻辑回归模型(LR)和用于构建药物-药物-不良事件组合相关风险分布的三组分混合模型(3CMM)构成。LR-3CMM模型可以实现对数据中每个药物组合的局部错误发现率的估计。以局部错误发现率作为药物-药物相互作用的度量标准,降低了结果中的假阳性率。模拟研究表明,LR-3CMM模型在检测两种药物相互作用方面优于现有方法。应用FAERS数据集的实例分析表明,LR-3CMM模型性能良好且检测出多个未被现有方法发现的药物-药物相互作用信号。
  第三,针对现有两种药物相互作用数据挖掘方法中缺乏对大规模混杂因素控制的问题,提出了一种用于SRS中药物-药物相互作用数据挖掘的倾向性评分校正的逻辑回归-三组分混合模型(PSLR-3CMM)。当SRS数据中存在大量可观测的混杂因素时,利用倾向性评分方法将所有的混杂因素整合为一个倾向性评分,一次性的处理了数据中所有的混杂因素,为控制大规模的混杂因素提供了解决方法。在PSLR-3CMM模型中,应用倾向性评分对药物-药物-不良事件组合的基线频率进行校正,从而避免了混杂因素对结果的影响。3CMM模型框架则为药物-药物相互作用信号提供了必要的假阳性控制,有效减少了结果中的假阳性信号。模拟研究表明,PSLR-3CMM模型在检测存在混杂因素的数据中的药物-药物相互作用方面具有优越的性能。选取联合用药作为FAERS数据集中的混杂因素,实验结果表明,PSLR-3CMM可以有效解决由联合用药造成的信号遮蔽问题,并且新发现了多个药物-药物相互作用信号。
  第四,针对目前用于多种药物相互作用数据挖掘的混合药物数目响应模型(MDRM)中存在的问题,提出了两个新的混合药物数目响应模型,分别为有最大风险阈值的固定概率混合药物数目响应模型(FMDRM-MRT)和有最大风险阈值的数目相关概率混合药物数目响应模型(CMDRM-MRT)。本文提出的两个模型不仅解决了MDRM中基线模型与药物数目响应模型在药物数目为1时不连续的问题,还对最大药物不良事件风险进行了限制。CMDRM-MRT模型进一步研究了模型中混合概率与药物数目之间的关系。为了提高结果的准确性,实验时联合使用了FAERS数据集和EMR数据集。实验结果表明,CMDRM-MRT模型和FMDRM-MRT模型在检测多种药物相互作用信号方面均优于MDRM模型,CMDRM-MRT模型的性能则要优于FMDRM-MRT模型。
  第五,针对现有的多种药物相互作用数据挖掘方法中缺乏对混杂因素控制的问题,提出了一种用于EMR中多种药物相互作用数据挖掘的混合条件逻辑回归模型(MCLRM)。EMR数据中的混杂因素会对数据挖掘的结果产生影响。本文采用病例-交叉设计方法处理EMR数据,有效解决了数据中一些无法观测的混杂因素带来的问题。针对病例-交叉设计的特点,提出了一种用于检测多种药物相互作用信号的MCLRM模型,首次实现了对病例-交叉设计中多种药物相互作用的数据挖掘。利用MCLRM模型,估计了每个药物组合的局部错误发现率,实现了对结果中假阳性率的控制。实验结果表明,MCLRM模型在挖掘EMR数据集中的多种药物相互作用信号方面具有良好的性能。
其他文献
海面舰艇作为现代海军主要装备,在执行海面任务的时候表现优秀。海面舰艇一般是以集群的形式航行,舰艇与舰艇之间通过相互发送通信信息实现实时调度,因此海面舰艇之间通信信号通常会承载许多重要信息,需要通过信息识别技术获取这些重要信息。非合作通信节点通联关系识别是目前新兴起的一种信息识别技术,通过识别非合作通信节点信息实现通联关系的识别。本文是在前人研究的基础上,运用神经网络、信号识别、位置识别以及数据挖掘
学位
立体视觉技术具有非接触、易操作和高精度等特点,近年来被应用于直升机桨叶运动参数测量方面并取得较好的效果。基于立体视觉的桨叶运动参数测量方法,是先通过在桨叶上粘贴或喷涂圆形标记点,再利用立体视觉技术获得的圆形标记点三维信息,解算出桨叶运动参数。圆形标记点的检测精度直接影响运动参数的测量精度,并且由于桨叶运动速度快,拍摄曝光时间短,导致图像存在欠曝光、边缘性弱的问题。因此,研究欠曝光图像的圆形标记点检
多目标优化问题普遍存在于实际应用中,如工程设计、路径规划及雷达探测系统等均属于多目标优化问题。随着社会的发展,优化问题涉及目标个数日益增多,研究如何求解高维多目标优化问题对于满足实际需求十分必要。Pareto支配选择机制在求解多目标优化问题上获得不错效果,但当拓展到高维多目标优化问题时会发生严重的性能退化。其主要原因在于,随着目标维数不断增加,非支配解在目标空间所占比例急剧增加,使得基于Paret
随着互联网的部署规模迅猛扩张,互联网服务深入人们生活各个角落。与过去有线、静态的传统网络环境相比,高干扰、高动态的网络场景广泛出现。这对网络数据传输性能提出了严苛的需求,亦成为网络架构革新的主要推动力之一。  智慧协同网络是一种全新设计的未来网络体系架构。它具有泛在缓存和族群适配的先进能力,赋予未来网络动态感知、自我调节的综合性、智能化功能,广泛适应未来网络性能、规模、移动性、安全性等更加复杂的需
车联网是未来移动通信的重要应用场景。在车联网的众多具体应用需求中,如何通过车联网将传统网络设备产生的海量数据实时、高效地上传至云端服务器是其中的一个重要需求。这一需求有着广泛的应用场景,例如高铁通信与应急通信。但是,针对这一需求,需要克服三点挑战。第一,单一无线链路传输的局限性;第二,传统网络设备对多链路传输的限制;第三,无线链路信号的波动对多链路协同传输的影响。  标识网络是基于国家973项目提
学位
无人潜航器(UUV)的回收控制在整个UUV的控制过程中至关重要。当前大多数关于UUV回收的研究中,回收母船都是静止的,动基座UUV回收研究甚少。在整个动基座UUV回收过程中,UUV与回收母船都处于运动中,两者的运动随着相互接近会互相干扰,UUV不仅要克服各种复杂约束限制,抵抗外界干扰,还要处理UUV与回收母船受干扰后发生碰撞的情况,所以,动基座UUV跟踪与对接阶段的研究具有一定难度。因此,在动基座
基于陀螺与星敏感器组合的姿态估计系统,广泛地应用于对姿态估计精度要求较高的航天器。由于航天器姿态估计模型呈现出较强的非线性特性,姿态估计一般使用非线性滤波算法。这些算法往往是卡尔曼滤波器的扩展形式。基于高斯滤波框架下的非线性卡尔曼滤波算法是在假定系统噪声和量测噪声均为高斯白噪声前提下获得滤波解。然而,从航天器的动态模型的推导方程式或从离散形式的航天器轨道运动学方程可知,姿态估计系统的噪声的概率密度
学位
张量广泛应用于信号处理、大数据科学、高阶马尔科夫链、机器学习和量子计算等领域中。近年来,张量特征值问题被提出并受到人们广泛关注和研究,它在齐次多项式系统、超图谱理论、超图划分、自动控制、图像处理、高阶马尔科夫链和多项式优化等领域有着重要应用。非线性系统是重要的动力学系统。稳定性是系统的一个基本属性,是系统理论研究中的重要问题,使用张量特征值研究非线性系统稳定性是一个新的研究课题,对系统的理论研究有
在实际的生活应用与社会生产中,存在许多具有复杂结构的系统,当系统内部存在相互关联的子系统时,该系统为耦合系统。耦合系统广泛地应用于众多领域中,包含航空技术、船舶发展、经济发展、工业制造以及农业生产等。然而子系统间的耦合联系令系统的分析与控制十分复杂,因此,为了更有效地控制耦合系统,系统的解耦研究是非常重要的。二阶线性系统的解耦研究具有十分重要的实用价值和理论意义,其广泛应用于诸多学科当中,如力学、
学位
蒸汽动力装置具有功率大,体积小,重量轻,振动小的优点,我国大型船舶多采用蒸汽动力装置,包括辽宁舰。但大型船舶蒸汽动力装置汽/水回路控制系统结构复杂、设备繁多、系统参数耦合关系复杂,还具有非线性及时滞等特点,系统运行过程中具有多个稳定工况及动态转换过程,系统工况多变且负荷干扰频繁。为保证大型船舶蒸汽动力装置汽/水回路稳定安全的运行,改善其控制效果,同时充分考虑到设备的实际动作能力及设备间耦合关系,进