论文部分内容阅读
研究背景:急性心肌梗死(acute myocardial infarction,AMI)是急危重症领域最常见的高危疾病之一,严重影响人类健康。据《中国心血管健康与疾病报告2020》报道,我国AMI死亡率呈不断上升趋势,给家庭和社会带来了巨大的经济负担。心脏骤停(cardiac arrest,CA)作为心肌梗死最严重的并发症,具有发病急骤、病情危重、预后差等特点。研究发现STEMI患者院内心脏骤停(in-hospital cardiac arrest,IHCA)的发生率接近8%,与未发生CA的患者相比,发生CA的AMI患者院内死亡风险显著升高。在发生CA前数小时甚至更长时间,患者的生命体征及病理生理状态就已经发生改变。因此,利用CA前的变量建立预测模型,对具有发生CA风险的AMI患者进行早期、准确的分类,筛选高危患者并对其进行及时有效的干预具有重要意义。当前较少有研究针对AMI这一人群建立CA预测模型,且已建立的模型存在着诸多应用限制,如模型的预测变量过多、变量获取途径复杂或计算方式繁琐等,因此亟需一种简便有效的风险预测模型。研究目的:1.筛选AMI患者发生IHCA的影响因素;2.运用不同的机器学习算法建立预测模型,并从中筛选出最佳的建模算法,构建一个准确有效的预测模型。研究方法:回顾性纳入MIMIC-Ⅲ数据库中符合入组条件的AMI患者。收集研究对象的一般资料、临床治疗资料、实验室检测资料和院内结局(是否发生IHCA)等。分组方法:首先将4775例AMI患者按3:1的比例随机划分为训练集(n=3581,CA=133)和测试集(n=1194,CA=40),训练集数据用于建模时调节最佳参数,测试集数据用于模型的性能评价;其次,根据患者是否发生IHCA,将其分为IHCA组与非IHCA组。对训练集的数据进行单因素分析、多因素Logistic回归(Logistic regression,LR)分析,筛选出AMI患者发生IHCA的独立影响因素,建立传统的LR预测模型。运用单因素分析中具有统计学意义的变量作为预测特征来构建决策树(decision tree,DT)、随机森林(random forest,RF)、XG Boost(extreme gradient boosting,XG Boost)、Light GBM(light gradient boosting machine,Light GBM)、神经网络及创新神经网络6种机器学习预测模型。使用测试集的数据,绘制各个预测模型的受试者工作特征曲线图(the receiver operating characteristic curve,ROC)、混淆矩阵图,计算相应的受试者工作特征曲线下面积(area under the receiver operating characteristic curve,AUC)、准确率、精准率、召回率及 F1 评分指标,对以上模型的预测性能进行相互比较,筛选出最佳的建模算法,建立最终的临床预测模型,比较其与国家早期预警评分(national early warning score,NEWS)、改良早期预警评分(modified early warning score,MEWS)之间的预测能力。研究结果:本研究共纳入4775例AMI患者,其中173例AMI患者发生IHCA,训练集与测试集的CA发生率分别为3.7%、3.4%。将训练集单因素分析中骤停组与非骤停组间差异具有统计学意义(P<0.05)的变量如心率等17项变量纳入到多因素Logistic回归分析中,结果显示心力衰竭、心率、氧饱和度、血红蛋白、血小板计数、血细胞比容、血糖、肌酸激酶同工酶8项变量是AMI患者发生CA的独立影响因素(P<0.05)。纳入以上8项因素构建传统的LR预测模型,该模型在内部验证中具有较好的区分度,其AUC为0.796,准确率、精确率、F1评分及召回率分别为0.773、0.086、0.151、0.600。纳入17项相关因素建立的DT模型在内部验证中的区分度较差,其AUC为0.664,准确率、召回率、精确率及F1评分分别为:0.905、0.250、0.108、0.150。RF模型在内部验证中的AUC、准确率、召回率、精确率及F1评分分别为:0.826、0.970、0.200、0.667、0.301。XG Boost 模型分别为 0.823、0.961、0.200、0.348、0.254。Light GBM模型分别为0.834、0.964、0.175、0.412、0.246。神经网络模型分别为0.755、0.888、0.325、0.108、0.163。创新神经网络模型为 0.714、0.899、0.325、0.123、0.178。对各个模型在训练集和测试集中的预测性能综合评价后,最终采用了 Light GBM算法建立临床预测模型,即M-BCS2模型,该模型仅由血清钠离子、镁离子、氧饱和度、血糖、肌酸激酶同工酶、血肌酐、舒张压7个变量组成。M-BCS2模型具有较好的区分度,AUC值约为0.800,准确率为0.960。无论是在测试集中还是训练集中,NEWS评分、MEWS评分的AUC均小于0.70,因此本研究建立的M-BCS2模型表现更好,为了便于临床护理人员使用,研究将该模型转化为网页版(详细网址:http://47.115.21.159:8002/)。结论:1.心力衰竭、心率、氧饱和度、血红蛋白、血小板计数、血细胞比容、血糖、肌酸激酶同工酶是AMI后发生心脏骤停的独立影响因素。2.基于Light GBM算法构建的M-BCS2模型,能较好的预测AMI患者发生IHCA风险。