论文部分内容阅读
背景:甲状腺癌(Thyroid carcinoma,TC)是常见的内分泌系统恶性肿瘤,近十年其发病率呈爆发式增长。世界卫生组织(World Health Organization,WHO)国际癌症研究机构(International Agency for Research on Cancer,IARC)2020 年公布的全球癌症报告数据显示乳腺癌以226万新发病例成为全球第一大癌症,而甲状腺癌新发病例达56.7万,占全部癌症的3.1%,排名第九位。我国甲状腺癌发病率亦迅猛增长,2019年国家癌症中心公布我国甲状腺癌的发病率为14.6/十万,其中女性发病率达22.56/十万,明显高于全球平均水平,位居女性恶性肿瘤排名第四位。超声(Ultrasonography,US)是甲状腺结节的常用检查手段,高分辨超声在随机抽查人群中对甲状腺结节的检出率可达19%-68%,利用超声进行甲状腺结节恶性风险分级已普遍应用于临床。自2009年智利学者Horvath首次提出了甲状腺成像报告和数据系统(Thyroid imaging reporting and data system,TI-RADS)以来,各国学者在此基础上不断改进,但目前尚无统一版本。2011年Kwak提出的TI-RADS和2017年美国放射学会(American college of radiology,ACR)提出的最新TI-RADS是目前国内沿用较多的两个版本,然而二者在中国人群的诊断效能仍缺乏大样本量数据支持。TI-RADS主要建立在超声影像学特征的基础上,但除影像学特征外,良恶性甲状腺结节在临床表现上也存在显著差异。我们的前期研究发现性别、年龄、结节大小、促甲状腺激素(Thyroid stimulating Hormone,TSH)水平、术前抗甲状腺球蛋白抗体(Anti-thyroglobulin antibody,TgAb)均与甲状腺乳头状癌(Papillary thyroid carcinoma,PTC)患病风险显著相关,建立临床与超声影像学特征相结合的风险预测模型将带来更大临床获益。目的:1、通过对比分析ACR版TI-RADS和Kwak版TI-RADS的诊断效能,在中国人群中评价TI-RADS对甲状腺结节性质评估的应用价值;2、基于大样本量临床数据,筛选PTC相关临床危险因素和超声影像学特征,利用机器学习法构建PTC预测模型并验证,为甲状腺结节的临床管理提出新的思路。方法:1、TI-RADS应用价值的对比研究:收集2000年-2015年解放军总医院收治并行手术治疗的甲状腺结节患者临床和超声影像学资料,纳入手术切除且病理诊断明确的良性结节和PTC,根据超声特征分别进行Kwak版TI-RADS和ACR版TI-RADS分级。以术后病理诊断为金标准,通过受试者工作特征曲线(Receiver operating characteristic curve,ROC curve)比较二者曲线下面积(Area under curve,AUC)、灵敏度、特异度、阳性预测值、阴性预测值、准确性,并在不同临床特征亚组中进行对比分析;2、分析良性结节和PTC患者临床特征的差异,筛选PTC相关的临床危险因素,联合超声影像学征象作为建立模型所需特征。选取临床资料、超声征象完整的1484个甲状腺结节作为模型数据集,通过可解释性机器学习的方法建立PTC预测模型。数据集被随机分为70%的训练集和30%的验证集,采用AUC、灵敏度、特异度、阳性预测值、阴性预测值和准确性评估预测模型的诊断效能,与Kwak版TI-RADS和ACR版TI-RADS对比,并对模型预测结果进行可视化解释。结果:(1)本研究共纳入7341例甲状腺结节患者,其中良性患者3437例,PTC 3904例:共8830个结节,其中良性结节4522个,PTC 4308个。对全部结节进行Kwak版TI-RADS和ACR版TI-RADS分级,以病理诊断作为金标准绘制ROC曲线。结果显示Kwak 版 TI-RADS的AUC 为 0.83(95%CI:0.82-0.84,P<0.001),诊断切点值为 4a,当分级在4a以上时PTC风险高,对应的灵敏度、特异度、阳性预测值、阴性预测值和准确率分别为 0.86、0.65、0.70、0.85 和 0.76。ACR 版 TI-RADS AUC 为 0.79(95%CI:0.78-0.80,P<0.001),诊断切点值为TR3,当分级在TR3以上时PTC风险高,对应的灵敏度、特异度、阳性预测值、阴性预测值和准确率分别为0.83、0.62、0.56、0.71和0.60;在不同性别、年龄、超声结节最大径(≤1cm和>1cm)、合并与未合并桥本甲状腺炎的亚组中分析结果显示Kwak版TI-RADS的ROC曲线下面积均高ACR版TI-RADS,两种TI-RADS均表现为在55岁以下、超声最大径>1cm与不合并桥本甲状腺炎的患者中诊断效能更高(P<0.001)。(2)对7341例甲状腺结节患者的临床特征分析结果提示年龄≤55岁、单叶结节(左叶、右叶、峡部)、TSH水平和TgAb 阳性是PTC的独立危险因素;对8830个甲状腺结节的超声影像学特征分析结果显示超声结节最大径≤1cm、纵横比>1、形态不规整、边界不清晰、微小钙化、实性构成、低回声是PTC相关的超声征象。以上述PTC相关临床表现和超声征象作为特征,在1484个结节组成的数据集中通过极端梯度提升(eXtreme gradient boosting,XGB oost)、随机森林(Random forest,RF)和逻辑回归(Logistic regression,LR)三种机器学习算法训练PTC预测模型,利用ROC评估模型诊断效能。结果显示XGBoost、RF和LR三种预测模型的AUC分别为0.91、0.90 和 0.90,均高于 Kwak 版 TI-RADS(0.89)与 ACR版 TI-RADS(0.85)。结论:Kwak版TI-RADS和ACR版TI-RADS甲状腺结节恶性风险分层系统均有较好的临床应用价值,整体而言Kwak版TI-RADS的诊断准确性高于ACR版TI-RADS。两种TI-RADS的诊断效能在不同年龄、超声结节大小以及合并桥本甲状腺炎的结节中存在差异。机器学习法构建临床联合超声影像学特征的PTC预测模型具有更优的诊断效能。