论文部分内容阅读
目的:心力衰竭的高住院率、高死亡率以及预后差已经成为全球关注的公共卫生问题,因此针对心衰患者构建疾病预后预测模型就极其重要。患者报告结局(Patient-reported Outcomes,PRO)数据不同于客观的病历数据,它从患者的角度汇报病情,量化了患者身体各方面的状态,能够全面地表达患者整体的健康。在上述基础上本课题基于随机森林、支持向量机和BP神经网络三种机器学习算法构建心衰患者预后模型,用最优模型比较纳入PRO数据前后模型的预测性能,探究PRO在心衰预后研究中的应用价值。方法:1、采用2017年5月至2019年11月在山西医科大学第一医院和山西省心血管医院住院确诊为心衰患者的PRO数据,经过数据预处理后获得796例有效数据。通过单因素分析筛选出有统计学意义的自变量,以筛选出的变量为输入变量,患者出院后一年内是否发生主要不良心血管事件(包括心源性死亡和心衰再住院)为结局变量,构建随机森林、支持向量机和BP神经网络分类预测模型,通过ROC曲线评价和比较其分类性能。2、通过比较筛选出最优模型,构建纳入PRO数据前后的心衰预后模型,用净重分类改善指数、整体鉴别指数以ROC曲线下面积AUC值,比较PRO数据在心衰预后模型中的增加价值。结果:1、通过单因素分析,筛选出与心衰预后相关的14个变量,分别为:年龄、性别、体重指数、舒张压、纽约分级、吸烟史、饮酒史、高血压、瓣膜病、肾功能不全、患者报告结局生理、心理、社会、治疗四个领域的评分。将其作为输入变量引入到随机森林、支持向量机和BP神经网络中,构建心衰患者主要不良心血管事件风险预测模型。2、模型预测性能评价与比较:随机森林分类预测模型评价指标分别为:AUC值0.806,灵敏度67.9%,特异度93.4%,准确度85.3%;支持向量机分类预测模型评价指标分别为:AUC值0.783,灵敏度65.5%,特异度89.7%,准确度83.2%;BP神经网络分类预测模型评价指标分别为:AUC值0.752,灵敏度61.9%,特异度87.3%,准确度79.2%。在本研究中随机森林模型表现最佳,支持向量机次之,BP神经网络表现一般。3、未纳入PRO数据的随机森林模型灵敏度为26.2%,特异度为90.6%,AUC值为0.584,纳入PRO数据后模型的AUC值为0.806,增加了 0.222,以未纳入PRO数据的预测模型为参照得出的NRI值为0.444、IDI值为0.105,经检验双侧P<0.05,改善程度均有统计学意义;在随机森林模型变量重要性评分中,PRO数据生理、心理、社会和治疗四个领域的得分分别为16.491、13.797、5.925、5.531,均高于其他变量,提示这些变量或有临床意义。结论:1、基于随机森林、支持向量机和BP神经网络构建心衰预后研究模型,随机森林模型的预测性能高于其他两种模型,表明随机森林模型在心衰预后研究中具有较高的应用价值。2、基于随机森林模型比较纳入PRO数据前后模型的预测性能,可以看出纳入PRO数据后模型的预测能力显著提高,且在随机森林模型变量重要性评分中PRO数据四个领域得分较高,表明PRO数据在心衰预后研究中有重要的意义。