论文部分内容阅读
目的:本研究旨在根据缺血性脑卒中(IS)患者磁共振成像(MRI)影像组学特征和临床诊疗数据以及四种机器学习算法来构建不同的机器学习IS复发风险预测模型,以预测IS患者一年内的复发风险。方法:收集2019年3月1日至2021年3月5日在南昌大学第二附属医院就诊住院诊断为IS患者的MRI图像和临床诊疗数据,随访患者1年内是否复发。由影像科医生在MRI检查中的扩散加权成像(DWI)序列上标注脑梗病灶,对标注图像进行一致性检验,提取DWI脑部影像组学特征,使用最小绝对收缩和选择运算符(LASSO)回归进行特征筛选。按照7:3的比例将数据随机拆分为训练集和验证集,使用逻辑回归(LR)、支持向量分类(SVC)、轻量梯度提升机(Light GBM)和随机森林(RF)四种机器学习算法构建复发预测模型。对于每种算法,又分别根据影像组学特征、临床诊疗数据以及影像组学特征和临床诊疗数据组合构建了3个模型。对比模型灵敏度、特异度和受试者工作特征(ROC)曲线下面积(AUC),评价各模型的预测功效。结果:研究共纳入IS患者612人,其中男性337(55.1%)人,女性275(44.9%)人,患者平均年龄63.9±11.16岁,有67(10.95%)名患者在随访1年内发生终点事件。吸烟史(χ~2=3.868,P=0.049)、既往卒中病史(χ~2=5.646,P=0.017)、既往缺血性心脏病病史(χ~2=4.695,P=0.030)、m RS评分(χ~2=5.008,P=0.025)、年龄(Z=-2.349,P=0.019)、白细胞计数(t=2.244,P=0.025)、中性粒细胞绝对值(Z=-1.967,P=0.049)、总蛋白(t=-2.391,P=0.017)、白蛋白(t=-2.725,P=0.007)、碱性磷酸酶(Z=-1.984,P=0.047)、肌酐(Z=-3.177,P=0.001)、凝血酶原时间(Z=-2.079,P=0.038)、国际标准比率(Z=-2.042,P=0.041)、纤维蛋白原浓度(Z=-2.689,P=0.007)等变量在复发组与未复发组之间的差异具有统计学意义。影像科医师标注的MDice系数、MIo U和豪斯多夫距离分别为0.87、0.77和4.36 mm,组内相关系数(ICC)平均值为0.98。从DWI图像中提取的1037个影像组学特征,特征筛选后共选择了20个影像组学特征,其中10个一阶特征,1个形态特征,9个纹理特征。构建基于三种不同数据组合与四种不同算法的预测模型,Light GBM算法所构建的模型在验证集中取得了最好的预测准确性。仅基于影像组学特征的Light GBM模型的灵敏度、特异度和AUC分别为65.0%、67.1%和0.647,而基于临床诊疗数据的模型的灵敏度、特异度和AUC分别为70.0%、79.9%和0.735。基于影像组学特征和临床诊疗数据组合的Light GBM模型取得了最佳性能,其灵敏度、特异度和AUC分别为85.0%,80.5%和0.789。模型显示,临床变量中有大血小板比例、吸烟史、年龄、纤维蛋白原浓度、血红蛋白、白蛋白、肌酐、白细胞计数、中性粒细胞绝对值和出院m RS评分可用于预测IS复发,影像组学中有一阶特征的峰度、偏度、极差范围和纹理特征中的High Gray-Level Zone Emphasis、Gray Level Non Uniformity等特征可用于预测IS复发。结论:基于Light GBM的缺血性卒中复发风险预测模型预测性能最佳。MRI影像组学特征和临床数据的结合可提高该模型的预测性能。吸烟史、年龄、出院m RS评分、纤维蛋白原浓度、白细胞计数、中性粒细胞绝对值、肌酐、白蛋白、血红蛋白等因素对IS复发风险预测具有重要意义,一阶特征中的峰度、偏度、极差范围与纹理特征中的High Gray Level Zone Emphasis、Gray Level Non Uniformity、Size Zone Non Uniformity是预测复发的重要因素。