论文部分内容阅读
目的:应用影像组学的方法深度挖掘晚期肺腺癌患者胸部CT图像中的数字化信息,探究影像组学特征对于其EGFR基因突变状态的预测价值。方法:(1)选取2013年4月至2019年9月期间青岛大学附属医院收治的339例晚期肺腺癌患者作为研究对象,按照其EGFR突变情况分为EGFR突变阳性组及EGFR突变阴性组,回顾性分析两组患者的年龄、性别、吸烟史、TNM分期等临床特征,采用SPSS 22.0软件进行数据的分析处理,计数资料用率(%)表示,组间比较采用χ~2检验,以P<0.05为差异有统计学意义。(2)从入组患者中随机挑选237例作为训练组,其余102例作为验证组,采用ITK-SNAP软件对所有患者胸部CT动脉期及静脉期图像中肿瘤的最大层面进行手动勾画,以作为感兴趣区(region of interest,ROI),应用A.K软件从勾画完成的ROI中进行影像组学特征的定量提取。应用最小冗余最大相关算法(minimum redundancy maximum relevance,mRMR)及最小绝对收缩与选择算子算法(the least absolute shrinkage and selection operator,LASSO)在训练组进行特征筛选。将筛选出的与EGFR基因突变高度相关的特征作为独立预测因子建立多因素logistic回归预测模型,利用受试者工作曲线(receiver operating curve,ROC)的曲线下面积(area under the curve,AUC)评估预测模型准确性并在验证组中进行验证,AUC的值越大表明模型的分类效果越好。结果:(1)EGFR突变阳性组182例,年龄范围为39~84岁,平均年龄63.5±8.8岁。EGFR突变阴性组157例,年龄范围为38~82岁,平均年龄64.3±8.1岁。EGFR突变阳性组女性患者比例显著高于EGFR突变阴性组(P<0.001)。EGFR突变阳性组不吸烟者比例高于EGFR突变阴性组(P=0.001)。两组患者在TNM分期方面差异无统计学意义(P>0.05)。(2)应用影像组学的方法从患者动脉期ROI中共提取了396个特征,应用mRMR算法排除掉一些冗余及不相关的特征后得到20个特征,采用LASSO算法筛选出与EGFR突变最具相关性的15个特征建立动脉期预测模型,AUC在训练组中为0.75,在验证组中为0.70。(3)应用影像组学方法从患者静脉期ROI中提取396个特征,应用mRMR算法筛选出20个特征,应用LASSO进一步降维筛选出5个特征建立静脉期模型,AUC在训练组中为0.69,在验证组为0.68。(4)将从动脉期ROI中提取的396特征与静脉期ROI中提取的396特征联合分析,应用mRMR筛选出30个特征,然后应用LASSO从中筛选出10个特征建立联合预测模型,AUC在训练组为0.76,在验证组为0.74。结论:(1)EGFR突变型晚期肺腺癌以女性、不吸烟者多见。(2)基于影像组学特征建立的预测模型对于晚期肺腺癌EGFR突变状态具有较高的预测性能。(3)动脉期影像组学模型的预测性能优于静脉期模型。(4)动脉期与静脉期的联合模型具有最高的预测性能。