论文部分内容阅读
目的:本研究基于术前较低级别胶质瘤(Lower Grade Gliomas,LGGs)的常规核磁共振成像(Magnetic Resonance Imaging,MRI)构建综合的机器学习(Machine Learning,ML)模型以预测LGGs异柠檬酸脱氢酶(Isocitrate Dehydrogenase,IDH)的突变状态。材料和方法:1.回顾性收集兰州大学第二医院病理结果证实为LGGs的患者227例,以7:3的比例将患者分为训练集(n=160)和验证集(n=67)。提取患者术前伦勃朗视觉感受图像(Visually Accessible Rembrandt Images,VASARI)特征,单变量分析选择与IDH突变相关的临床和VASARI特征,使用最小绝对值收缩和选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)回归分析筛选出与IDH突变密切相关的VASARI特征;基于临床和VASRI特征构建预测LGGs IDH突变的临床-VASARI特征模型。以受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC)及相应的曲线下面积(Area Under the Curve,AUC)值评估模型的预测性能。2.回顾性收集兰州大学第二医院病理结果证实为LGGs患者136例,所有患者均具备完善的T1加权成像(T1-weighted imaging,T1WI),T2加权成像(T2-Weighted Imaging,T2WI),T1加权对比增强成像(T1 Weighted Contrast-Enhanced Imaging,T1C)和T2液体衰减反转恢复(Fluid Attenuated Inversion Recovery,FLAIR)序列。将纳入病例按大约7:3的比例分为训练集(n=96)和验证集(n=40)。从上述四个MR术前序列提取影像组学(Radiomics)特征,应用单变量分析和LASSO方法筛选出每个序列中与IDH突变密切相关的Radiomics特征作为影像组学标签(Radiomics Signature,RS)。应用多因素逐步逻辑回归方法构建基于多序列融合的影像组学融合模型(All-model)。利用单变量和多变量分析筛选与IDH突变相关的VASARI特征,通过融合VASARI特征和Radiomics特征构建临床-影像组学综合模型(COMB-model),在此基础上构建列线图(Nomogram)。应用ROC曲线及AUC值、校准曲线(Calibration Curve,CC)和决策曲线(Decision Curves,DC)评估各模型的预测性能和临床实用性。3.回顾性收集兰州大学第二医院病理结果证实为LGGs、且具有术前常规MRI(T1WI,T2WI,T1C和FLAIR)的138例患者,按5:1的比例随机分为训练集(n=115)和验证集(n=23)进行六折交叉验证训练模型。基于上述四个序列的MRI分别构建MR单序列和多序列三维密集连接卷积网络(Three Dimensional-Densely Connected Convolutional Networks,3D-Dense Net)结构的深度学习(Deep Learning,DL)预测模型。应用ROC曲线及AUC值、准确度(Accuracy)、灵敏度(Sensitivity)、特异度(Specificity)、阳性预测值(Positive Predictive Value,PPV)、阴性预测值(Negative Predictive Value,NPV)、假阳率(False Positive Rate,FPR)、假阴率(False Negative Rate,FNR)、误报率(False Discovery Rate,FDR)、F1值、混淆矩阵等评估每个模型的预测性能并对其进行比较。结果:1.LGGs患者术前VASARI特征中,经单因素分析后有11个VASARI特征与IDH突变状态相关。经LASSO回归降维后最终有5个VASARI特征与IDH突变密切相关。它们的名称和系数分别为F1(Tumor Location),-0.315;F6(Proportion n CET),0.171;F11(Thickness of enhancing margin),-0.168;F20(Cortical involvement),-0.037和F30(Lesion Size Y),0.004。基于此5个VASARI特征我们构建了LGGs IDH的预测模型。模型在训练集中的AUC、Sensitivity和Specificity分别为0.801、0.840和0.722;验证集中预测模型的AUC、Sensitivity和Specificity分别为0.752、0.921和0.517。2.从每例患者的MR序列中共提取出4148个影像组学特征,进一步筛选出与LGGs IDH突变显著相关的11个特征(T1WI:2个,T1C:3个,T2WI:4个,FLAIR:2个)。在单序列模型和影像组学融合模型中,后者的性能最佳,其在训练集和验证集中的AUC、Accuracy、Sensitivity分别为0.896、0.802、0.710和0.843、0.725、0.615。而由VASARI特征和影像组学特征综合构建的临床-影像组学综合模型(COMB-model)具有最好的预测性能,在训练集和验证集中的AUC、Accuracy、Sensitivity分别为0.925、0.865、0.806和0.907、0.800、0.769。校准曲线分析显示COMB-model预测的IDH突变概率与实际突变概率具有较好的一致性。临床决策曲线分析也表明COMB-model的净收益最佳。3.基于T1WI、T2WI、T1C和FLAIR四种单序列MRI构建的3D-Dense Net模型中,以FLAIR序列构建的3D-Dense Net模型性能最佳。基于FLAIR的3D-Dense Net模型在训练集中的预测准确率为0.800(AUC=0.953),在验证集中的预测准确度为0.703(AUC=0.773)。多序列融合模型在训练集中的最佳准确度为0.922(AUC=0.998),在验证集中的准确度为0.783(AUC=0.854)。多序列融合模型的预测性能优于单序列模型。结论:1.基于常规MRI的VASARI特征模型、影像组学模型和深度学习模型均可非侵入性的预测LGGs IDH突变状态。在所有模型中,深度学习模型的预测性能最佳。2.在机器学习模型中,多参数、多序列的融合模型具有更好的预测性能,可以作为术前无创的预测LGGs IDH突变状态的重要辅助手段。