基于特征选择与改进Stacking集成算法的华法林剂量预测研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:qncy1232f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
华法林(warfarin)是一种口服抗凝血药物,广泛应用于心脏瓣膜置换、房颤等术后抗凝,也常用于多种血液栓塞性疾病的抗凝治疗。华法林在抗凝治疗过程中,存在治疗窗窄、副作用大、患者个体剂量差异大的问题,要求剂量必须精确。临床使用中必须对患者进行采血,依据血液中的国际标准化比值(International Normalized Ratio,简称INR)监测抗凝效果。患者必须要面对长期、频繁的采血,并根据血液监测结果调整华法林剂量,直到INR值达标同时剂量稳定。在此过程当中,患者会长时间面临着因剂量不足导致血栓形成的风险,同时也面临着因剂量过大导致的出血风险。临床上一般会通过已有的华法林剂量预测模型,根据患者自身的相关指标,计算出理想INR值范围内的华法林剂量,并将该剂量作为初始的治疗剂量,如果预测的初始剂量无限接近后期达到的稳定剂量,患者就可以一直使用最有效、最安全的剂量进行抗凝治疗,有效避免在治疗中出现不良反应。华法林剂量预测的研究,是将患者人口学、临床因素等作为模型的输入特征,通过回归算法形成剂量预测模型。国际公认的华法林剂量预测模型是国际华法林药物遗传学联合会(International Warfarin Pharmacogenetics Consortium,简称IWPC)基于线性回归算法建立的IWPC模型。IWPC在预测模型的研究中,发现细胞色素P4502C9(CYP2C9)和维生素K环氧化物还原酶复合物1(VKORC1)基因多态性,对华法林的治疗剂量有显著影响。由于基因型与剂量之间不存在线性关系,所以华法林剂量预测实际上是一个多元非线性回归任务。机器学习在完成非线性回归任务方面有一定的优势,通过机器学习建立的模型可以融合大量的输入特征,发现变量特征的非线性关系。目前国内外华法林剂量预测模型使用的算法,也由线性回归算法转为机器学习算法。在机器学习领域中,集成学习可以较大程度上提高算法的精确度,并增强算法的稳定性。本文基于IWPC提供的公开样本数据,利用特征选择和Stacking集成算法建立了华法林剂量预测模型。针对数据维度大同时存在冗余特征的情况,采用RRelief F算法计算特征权重并结合相关性检验的方法,共同完成特征选择过程并形成最优特征子集,经基学习器和Stacking集成模型验证,经过特征选择形成的最优特征子集,在预测性能上优于原始数据集,能够更好地解释IWPC数据集中所有特征对剂量的影响能力。本文对传统Stacking集成算法进行了改进,针对传统Stacking算法中K折交叉验证采用平均值形成测试集的环节,将平均值改进为RMSE倒数加权平均,并且将最优特征子集的特征关系输入到元学习器,结合基学习器的预测结果共同作为元学习器的特征输入,形成了改进Stacking算法。实验结果证明,最优特征子集结合改进Stacking算法建立的华法林剂量预测模型,各方面性能均优于基学习器和传统Stacking算法建立的模型。同时对比当前临床应用的IWPC公式和基于多元线性回归(MLR)建立的预测模型,各方面性能均有一定的提升。
其他文献
滚动轴承是滚动设备中承载着旋转工作的主要部件。精准的诊断出轴承在运行时产生的故障,对保障工业生产,稳定产品性能,减少或避免重大生产事故甚至灾难,有着重要的意义。现代
本论文的研究工作以玻璃碳电极为基底材料,通过两步电化学沉积法将聚氨基酸(Poly(amino acid))和一种含钬离子杂金属氰桥配位聚合物(Ho(Ⅲ)-Fe(Ⅲ)-WO42-CyHMCP)复合修饰到电
随着人工智能的发展,无人驾驶已成为当今研究的热点之一。由于在道路信息当中,提供最多信息的是交通标志,故无人驾驶的关键之一便是建立对交通标志进行检测与识别的驾驶辅助
目标检测和实例分割任务都是对图像中的每一个对象进行辨别,它们具有一定的相似性,很多工作也在目标检测的基础上完成实例分割任务。二阶段目标检测模型可以通过简单的扩展就
本文以黄河流域为研究对象,从流域气象干旱出发,在气象干旱的概念、量化指标、驱动因素、评估、预测等方面开展一系列研究工作。基于流域站点降水、气温等气象要素,分析各分
本论文主要包括以下两章内容:第一部分:简述了(1)多环芳烃类化合物的应用(2)苯并芴类化合物的应用(3)苯并芴类化合物的合成方法环状骨架的构建是合成化学的核心问题。苯并芴是一类重要的多环芳烃化合物,具有许多特殊的性质,在材料科学和生物化学等多个领域有着广阔的应用前景。这些四环骨架和相关衍生物也广泛存在于天然产物中。然而,它们的合成方法,特别是苯并[a]芴的合成方法非常有限,到目前为止文献中只能找到
随着互联网的飞速发展,人们对于接入网的速率要求越来越高。EPON作为最受欢迎的接入网解决方案,在世界范围内大规模部署。由于EPON在上行链路上采取时分复用的方式避免冲突,
随着无线通信产业的发展,无线通信中使用的信号带宽越来越宽,频谱需求越来越大,但可用的频谱资源越来越紧张。为节约频谱资源及实现最大化利用,带内全双工(IBFD)技术应运而生
近年来,随着互联网和智能设备的不断发展,视频成为了重要的信息载体,同时为了安防起见,越来越多的公共场所都安装了视频监控设备。在视频数量呈现爆炸式增长的背景下,如何让
政府购买公交服务是政府提供公共服务的新方式,是公共交通的公益性和市场化有机结合的新探索,对于公共交通的供给和公交服务水平的提高有极大的促进作用,进而确立了公共交通在城市交通中的主导地位。相较于过去单纯的政府补贴、政府补偿而言,政府购买具有更大的主动性,促进了公平竞争,激发了市场活力,使城市居民真正受益。但是,政府采取何种方式购买、购买时的标准如何规定、怎样通过购买有效提高城市公交的服务效率等问题则