论文部分内容阅读
研究目的:构建区分表现为磨玻璃结节(Ground-glass opacity nodules,GGO)的良性病变和早期肺腺癌病变、肺腺癌浸润前病变和浸润性病变、不同病理亚型的浸润性腺癌病变以及不同驱动基因突变状态肺腺癌病变的影像组学模型,并同临床和影像学参数模型及CT(computerized tomography,计算机断层扫描成像)定量参数模型进行比较,来探讨影像组学模型在上述方面的诊断效能和临床应用价值。研究方法:1)选取在2018年1月至2021年4月间于中国人民解放军总医院经临床确诊、有明确病理检查结果和完备的临床和薄层CT资料的1269例肺磨玻璃结节患者(男性476人,女性793人;年龄:18岁~79岁),并按照不同研究方向分别将患者分层随机纳入训练组和验证组中,其中训练组的数据参与模型构建,验证组中的数据仅用于模型验证。通过本院病例系统检索并收集全部患者的临床和CT影像资料,同时评估、记录相应的影像学参数特征。2)使用3D slicer软件勾画并获取全部GGO内部及周围5mm区域中的共2446个影像组学特征,并使用神州德信数字肺软件获取全部GGO的27个CT定量参数特征。在训练组数据中,应用单因素分析和套索回归(Least absolute shrinkage and selection operator,LASSO)筛选出重要性最高的影像组学特征,并在训练组中分别利用逻辑回归(Logistic regression,LR)、决策树(Decision tree,DT)、支持向量机(Support vector machine,SVM)和自适应增强(Adaptive boosting,AB)四种机器学习方法建立影像组学模型,同时利用LR建立临床和影像学参数模型以及定量参数模型,并构建拟合上述三种模型的联合模型及列线图。3)在验证组数据中采用受试者工作曲线(Receiver operating characteristic curve,ROC)的曲线下面积(Area under the curve,AUC)作为主要指标,准确度(Accuracy,ACC)、灵敏度(Sensitivity,SEN)、特异度(Specificity,SPE)及F1分数作为次要指标来评价不同模型的诊断效能差异,并利用临床决策分析(Decision curve analysis,DCA)来评价各模型的临床应用价值。采用R软件(版本号4.0.2)和SPSS软件(版本号22.0)进行数据统计分析和模型构建。研究结果:1)本研究中纳入了良性病变131例,早期肺腺癌215例。在临床和影像学参数中,采用多元逻辑回归发现吸烟、胸外恶性肿瘤病史和毛刺征是GGO是否为早期肺腺癌的独立风险因素;在定量参数中,体积钙化是GGO是否为早期肺腺癌的独立风险因素。通过LASSO回归筛选出12个影像组学参数并利用SVM法构建模型,该模型在验证组中ROC曲线的AUC为0.851,优于临床和影像学参数模型(AUC=0.506)、定量参数模型(AUC=0.520),并表现出了最佳的临床应用价值。2)在鉴别浸润前病变和浸润性病变方面,共纳入浸润前病变(包括不典型腺瘤样增生和原位癌)139例及浸润性病变(包括微浸润腺癌和浸润性腺癌)879例。在训练组中,有无肿瘤标记物异常、结节密度、有无分叶征和结节直径这4个指标为GGO是否为浸润性病变的独立风险因素;同时,在定量参数中,表面积/体积和密度第90位百分位数这2个指标为结节是否为浸润性病变的独立风险因素。利用LASSO回归筛选出的16个影像组学参数建立LR模型,其在验证组中ROC曲线的AUC为0.828,显著优于临床和影像学参数模型(AUC=0.746);单独利用结节周围特征建立的影像组学模型AUC也可达0.808。联合影像组学模型、临床和影像学参数模型以及定量参数模型的联合模型在验证组中的AUC可达0.875,且具有最佳临床应用价值。3)将纳入的浸润性肺腺癌按照病理亚型分为贴壁为主型(共338例)和非贴壁为主型(共243例)。经过单因素分析和逐步向前法多元逻辑回归筛选,临床和影像学参数模型中纳入结节密度1个参数;定量参数模型中则纳入表面积/体积和结节第75百分位数2个参数。采用SVM法建立影像组学模型,其在验证组中ROC曲线的AUC为0.692,优于临床和影像学参数模型(AUC=0.556),与定量参数模型相近(AUC=0.679)。采用影像组学模型来判断贴壁为主型和非贴壁为主型浸润性腺癌,较临床和影像学参数模型及定量参数模型具有更高的临床应用价值。4)本研究纳入EGFR(Epidermal Growth Factor Receptor,表皮生长因子受体)基因突变阴性患者109例,EGFR突变阳性患者119例。在临床和影像学参数中,发现性别、胸外恶性肿瘤家族史和肿瘤标记物异常是EGFR突变状态的独立风险因素,而全部CT定量参数均不是EGFR基因突变状态的独立风险因素。采用LR法建立的影像组学模型在验证组中表现出了一定的诊断能力(AUC=0.637),优于临床和影像学参数模型(AUC=0.585)。联合影像组学模型以及临床和影像学参数模型的联合模型,在验证组中AUC可达0.653,且具有最佳临床应用价值。5)本研究纳入ALK(Anaplastic lymphoma kinase,间变性淋巴瘤激酶)基因突变阴性患者654例,阳性患者101例。在训练组中,临床和影像学参数模型纳入症状、毛刺征和结节直径3个参数,而定量参数模型中纳入了非实性比例和密度第10百分位数2个参数。利用LR法建立的影像组学模型在验证组ROC曲线的AUC为0.736,显著优于临床和影像学参数模型(AUC=0.682)和定量参数模型(AUC=0.584),且经DCA评估具有较高的临床净获益。拟合上述三个模型的联合模型并未能提高影像组学模型的诊断效能(AUC=0.712)。研究结论:1)影像组学在鉴别表现为GGO的良性病变和早期肺腺癌病变、肺腺癌浸润前病变和浸润性病变以及ALK基因突变阳性和阴性的病变上,表现出了较高的诊断效能;在区分贴壁为主型和非贴壁为主型浸润性肺腺癌以及不同EGFR基因突变状态的肺腺癌上,表现出了一定的诊断效能,但尚未达到临床应用水平。但在上述所有方面,影像组学均表现出了优于临床和影像学特征的诊断效能和临床应用价值;2)CT定量参数在区分肺腺癌浸润前病变和浸润性病变以及识别贴壁为主型浸润性肺腺癌方面,具有和影像组学类似的诊断能力,但在区分良性病变和早期肺腺癌病变以及不同EGFR、ALK基因突变状态的肺腺癌方面,具有较差的诊断效能,提示CT定量参数的应用范围有限;3)结节周围5mm区域内的影像组学参数在区分表现为GGO的良性病变和早期肺腺癌病变、肺腺癌浸润前病变和浸润性病变、贴壁为主型和非贴壁为主型浸润性肺腺癌以及不同EGFR、ALK基因突变状态的肺腺癌中均表现出了一定的诊断价值。综上,影像组学参数在表现为GGO的早期肺腺癌的良恶性鉴别、浸润性评价、病理亚型区分和基因突变状态评估上,均体现出了一定的诊断效能,具有潜在的临床应用价值。