论文部分内容阅读
第一部分基于MR影像组学和机器学习预测肝癌病理分级研究背景与目的:肝细胞癌(hepatocellular carcinoma,HCC),简称肝癌,术后复发率高,预后差。HCC病理分级是判断患者预后的重要因子。本研究拟探索MR影像组学特征在术前预测肝癌病理分级中的价值,建立并验证基于MR影像组学特征和机器学习的肝癌病理分级术前预测模型。方法:经纳入和排除标准筛选,本研究共纳入281例经手术切除病理确诊为单发肝癌的患者。按7:3的比例随机分成训练集(n=210)和测试集(n=71)。回顾性分析患者的临床和MR影像资料,包括年龄、性别、血清AFP水平,并判读肿瘤影像特征:肿瘤大小(分组:≤3cm和>3cm)、边缘、包膜、动脉期瘤周异常强化影、肝胆期瘤周低信号影、瘤内脂肪、坏死和出血。提取钆塞酸二钠MR T1加权成像(T1 weighted imaging,T1WI)增强前和增强后动脉期(arterial phase,AP)、门静脉期(portal venous phase,VP)、延迟期(delayed phase,DP)及肝胆期(hepatobiliary phase,HBP)影像组学特征。使用组内相关系数(intraclass correlation coefficient,ICC),最大相关最小冗余(maximum relevance minimum redundancy,m RMR)、最小绝对收缩和选择算子(least absolute shrinkage and selection operator algorithm,LASSO)和基于随机森林(random forest,RF)的递归特征消除法(recursive feature elimination,RFE)筛选与病理分级相关的MR影像组学特征。采用基于赤池信息准则(Akaike information criterion,AIC)的逐步逻辑回归(logistic regression,LR)方法筛选与病理分级相关的临床影像特征。应用支持向量机(Support Vector Machines,SVM)、多层感知机(Multi-layer Perceptron,MLP)、极限树分类器(Extra Trees Classifier,ETC)和极端梯度提升器(e Xtreme Gradient Boosting,XGBC)机器学习分类算法建立术前预测病理分级的模型,并对模型的鉴别和校准效能进行评估。结果:经多因素逐步逻辑回归筛选出与肝癌病理分级相关的临床影像特征包括:年龄、血清AFP水平、肿瘤大小分组和动脉期瘤周异常强化。在测试集中,基于这些特征建立的临床影像模型AUC分别为0.608(SVM)、0.601(MLP)、0.597(ETC)和0.615(XGBC)。从每个期相感兴趣区(region of interest,ROI)中各提取851个影像组学特征,5个期相图像共提取4255个。剔除ICC<0.8的特征后,经m RMR、LASSO和RFE(RF)筛选,最终得到20个影像组学特征。在测试集中,基于这20个MR影像组学特征建立的影像组学模型AUC分别为0.728(SVM)、0.732(MLP)、0.725(ETC)和0.759(XGBC)。在测试集中,基于临床影像特征和MR影像组学特征建立的联合模型AUC分别为0.762(SVM)、0.701(MLP)、0.711(ETC)和0.719(XGBC)。影像组学模型和联合模型的效能均优于临床影像模型。各影像组学模型和联合模型之间ROC差异均无统计学意义(De Long test:p>0.05)。结论:基于MR增强前和增强后多期影像组学特征建立的机器学习模型(SVM、ETC、MLP和XGBC)能对肝癌病理分级进行较好的预测。临床影像特征在预测肝癌病理分级方面的效能较差,纳入这些特征不能提高影像组学特征的预测效能。ETC和XGBC影像组学模型在预测肝癌病理分级中的效能优于其他模型。第二部分基于MR影像组学和机器学习预测肝癌微血管浸润研究背景与目的:微血管浸润(microvascular invasion,MVI)是肝癌患者术后早期复发和不良预后的高危因素。术前预测MVI对制定手术方案具有重要意义。本研究拟探索MR影像组学特征在术前预测肝癌MVI中的价值,建立并验证基于MR影像组学特征和机器学习的肝癌MVI术前预测模型。方法:经纳入和排除标准筛选,本研究共纳入232例经手术切除病理确诊为单发HCC患者。按7:3的比例随机分成训练集(n=174)和测试集(n=58)。回顾性分析患者的临床和MR影像资料,包括年龄、性别、血清AFP水平,并判读肿瘤影像特征:肿瘤大小(分组:≤3cm和>3cm)、边缘、包膜、动脉期瘤周异常强化影、肝胆期瘤周低信号影、瘤内脂肪、坏死和出血。提取钆塞酸二钠MR T1WI增强前和增强后动脉期、门静脉期、延迟期及肝胆期图像中瘤体和瘤周1cm区域的MR影像组学特征。使用ICC、m RMR、LASSO算法选择与MVI相关的MR影像组学特征。采用基于AIC的逐步逻辑回归方法筛选与MVI相关的临床影像特征。应用支持向量机(SVM)、逻辑回归(LR)、多层感知机(MLP)和极限树分类器(ETC)4种机器学习分类算法建立肝癌MVI术前预测模型,并对模型的鉴别和校准效能进行评估。结果:经多因素逐步逻辑回归筛选出与肝癌MVI相关的临床影像特征包括:年龄、AFP水平、肿瘤大小、包膜及瘤周异常强化。在测试集中,基于这5个特征建立的临床影像模型的AUC分别为0.746(SVM)、0.762(LR)、0.750(MLP)和0.790(ETC)。从每个ROI中各提取851个影像组学特征,5个期相15个ROI图像共提取12765个。剔除ICC<0.8的特征后,经m RMR、LASSO、再LASSO筛选,最终得到14个MR影像组学特征。在测试集中,基于这14个MR影像组学特征建立的影像组学模型的AUC分别为0.751(SVM)、0.726(LR)、0.736(MLP)和0.778(ETC)。结合5个临床影像特征和14个影像组学特征建立联合模型I。在测试集上,联合模型I的AUC分别为0.766(SVM)、0.816(LR)、0.816(MLP)和0.826(ETC)。基于14个影像组学特征计算得到患者的影像组学标签Radscore。训练集和测试集上,MVI阳性组和阴性组患者的Radscore差异具有显著统计学意义(p<0.05)。结合5个临床影像特征和影像组学标签Radscore建立联合模型II。在测试集中,联合模型II的AUC分别为0.767(SVM)、0.781(LR)、0.789(MLP)和0.785(ETC)。联合模型稍优于影像组学模型,但模型ROC之间差异无统计学意义(De Long test:p>0.05)。结论:基于瘤体和瘤周多期MR影像组学特征建立的机器学习模型(SVM、LR、MLP和ETC)能对肝癌MVI进行较好的预测。影像组学标签Radscore值越高,患者存在MVI的风险也高。联合模型优于临床影像模型和影像组学模型,其中联合模型I(ETC)模型稍优于其他模型。第三部分基于MR影像组学和机器学习预测肝癌Ki-67表达研究背景与目的:Ki-67是肿瘤增殖的生物标志物。Ki-67指数越高提示肝癌的侵袭性越强,预后差。探索MR影像组学特征在术前预测肝癌Ki-67表达中的价值,建立并验证基于MR影像组学特征和机器学习的术前预测肝癌Ki-67表达模型。方法:经纳入和排除标准筛选,本研究共纳入210例经手术切除病理确诊为单发肝细胞癌患者。按7:3的比例随机分成训练集(n=157)和测试集(n=53)。回顾性分析患者的临床和MR影像资料,包括年龄、性别、血清AFP水平,并判读肿瘤影像特征:肿瘤大小(分组:≤3cm和>3cm)、边缘、包膜、动脉期瘤周异常强化影、肝胆期瘤周低信号影、瘤内脂肪、坏死和出血。提取钆塞酸二钠MR T1WI增强前和增强后动脉期、门静脉期、延迟期及肝胆期影像学特征。使用ICC、m RMR、LASSO算法筛选与肝癌Ki-67表达相关的MR影像组学特征。采用基于AIC的逐步逻辑回归筛选与肝癌Ki-67表达相关的临床影像特征。应用LR、SVM、MLP和ETC机器学习分类算法建立术前预测肝癌Ki-67表达模型,并对模型的鉴别和校准效能进行评估。结果:经多因素逐步逻辑回归筛选出与肝癌Ki-67表达相关的临床影像特征包括:性别、Log AFP水平、肿瘤大小分组和瘤内脂肪。在测试集中,基于这4个特征建立的临床影像模型的AUC分别0.790(LR)、0.775(SVM)、0.781(MLP)和0.785(ETC)。从每个ROI中各提取851个影像组学特征,5个期相ROI共提取4255个。剔除ICC<0.8的特征后,经m RMR、LASSO再LASSO筛选,最终得到30个影像组学特征。在测试集中,基于这30个MR影像组学特征建立的影像组学模型的AUC分别为0.810(LR)、0.817(SVM)、0.814(MLP)和0.808(ETC)。结合临床影像特征和影像组学特征建立联合模型I,AUC分别为0.839(LR)、0.827(SVM)、0.864(MLP)和0.813(ETC)。基于30个影像组学特征计算的影像组学标签Radscore在Ki-67高表达和低表达组患者之间具有显著性差异(p<0.05)。结合临床影像特征和影像组学标签Radscore建立联合模型II,在测试集中的AUC分别为0.813(LR)、0.825(SVM)、0.803(MLP)和0.824(ETC)。影像组学模型、联合模型I、II之间ROC差异均无统计学意义(p>0.05)。结论:基于MR增强前和增强后多期影像组学特征建立的机器学习模型(LR、SVM、MLP和ETC)能对肝癌Ki-67表达情况进行较好的预测。影像组学标签Radscore值越高,患者Ki-67高表达的风险也高。联合模型优于临床影像模型和影像组学模型,其中联合模型I(MLP)模型稍优于其他模型。