论文部分内容阅读
第一部分甲状腺风险分级指南诊断甲状腺恶性结节准确性比较目的:超声作为评估甲状腺结节最佳的影像学检查,多个权威协会在二维超声(B-mode ultrasound,BMUS)图像基础上制定了风险分级指南。本研究旨在比较4种甲状腺风险分级指南,包括Kwak版甲状腺影像报告和数据系统(Thyroid Imaging Reporting and Data System by Kwak,Kwak TI-RADS)指南、美国甲状腺协会(American Thyroid Association,ATA)《成人甲状腺结节与分化型甲状腺癌指南》指南、欧洲甲状腺协会(European Thyroid Association,EU)TI-RADS及美国放射学会(American College of Radiology,ACR)TI-RADS 指南,诊断甲状腺恶性结节和细针穿刺(fine-needle aspiration,FNA)推荐的准确性。方法:1.本研究纳入南昌大学第一附属医院2019年1月至2020年9月经手术后病理验证的最大径线大于等于10mm的甲状腺结节451例。2.对两位不同熟练程度的超声医师(工作经验分别为3年和10年以上)分别运用 Kwak TI-RADS、ATA、EU TI-RADS 和 ACR TI-RADS 指南对甲状腺结节良恶性分类并推荐活检。3.评估指南每个分级类别与结节病理结果之间的关系。4.比较不同指南诊断恶性结节的敏感度、特异度、阳性预测值、阴性预测值、准确度和受试者工作曲线下面积(area under the receiver operator characteristic curve,AUC)。5.对于给出FNA推荐的ATA和ACR TI-RADS指南,比较非必要FNA率。结果:1.所纳入451例结节中恶性结节比例为65.2%(294/451)。Kwak TI-RADS、ATA、EU TI-RADS和ACR TI-RADS指南评分所根据的五类超声特征(实质、回声、形状、边缘和钙化)在良恶性结节中的分布均存在差异(p<0.05)。2.不同熟练程度的医师4个指南所评分级均与病理结果有统计学意义的相关性,其中ACR TI-RADS指南相关系数最高(高级医师:0.505,初级医师:0.459;p<0.001)。3.高级医师和初级医师敏感度、阴性预测值和准确度最高者同样为ACR TI-RADS指南。高级医师的指南评分的特异度和阳性预测值最高者为Kwak TI-RADS指南,而初级医师指南评分的特异度和阳性预测值最高者为EU TI-RADS指南。4.与 Kwak TI-RADS、ATA 和 EU TI-RADS指南比较,ACR TI-RADS指南的AUC最高,高级医师所评得分AUC为0.814(95%CI 0.770-0.857),初级医师所评得分 AUC 为 0.786(95%CI 0.741-0.830),显著高于 Kwak TI-RADS、ATA和EUTI-RADS指南的诊断效能(p<0.05)。5.不同熟练程度的超声医师使用ACR TI-RADS指南均低于使用ATA指南的非必要FNA率(高级医师:20.25%vs.29.16%,初级医师:26.45%vs.34.30%)。结论:不同熟练程度超声医师应用ACR TI-RADS指南均可较其他指南显著提高甲状腺恶性诊断准确性,并可以减少甲状腺结节的非必要FNA推荐率,是目前值得推荐的甲状腺风险分级指南。第二部分联合ACR TI-RADS和基于超声的影像组学的列线图诊断甲状腺恶性结节研究目的:影像组学可以发现并量化目视无法评估的影像图像特征,是一个可以在肿瘤诊断中具有巨大潜能的影像学工具。本研究旨在基于二维超声(B-mode ultrasound,BMUS)图像构建一个影像组学分数(radiomic score,Rad-Score),并建立和验证一个由美国放射学会(American College of Radiology,ACR)甲状腺影像报告和数据系统(Thyroid Imaging Reporting and Data System,TI-RADS)和Rad-Score组成的恶性甲状腺结节预测列线图。方法:1.本研究纳入南昌大学第一附属医院2019年1月至2020年9月经手术后病理验证的最大径线大于等于10mm的甲状腺结节451例,按照7:3的比例随机分为训练组(n=315)和验证组(n=136)。2.使用3D Slicer对甲状腺结节径线最大切面的BMUS图片进行感兴趣区域(Region of interest,ROI)勾画,Pyradiomics 进行特征提取。3.使用训练组甲状腺结节特征进行筛选和提取,构建Rad-Score,并于验证组验证。诊断准确性评估使用受试者工作曲线下面积(area under the receiver operator characteristic curve,AUC)。4.对训练组结节的Rad-Score和不同熟练程度(工作经验分别为3年和10年以上)的超声医师评分的平均ACR TI-RADS分数(ACR-Score)结合建立一个影像组学(ACR-Rad)列线图,并于验证组中验证。诊断表现评估使用AUC、综合判别改善指数(index integrated discrimination improvement,IDI)和净重新分类改进(net reclassification improvement,NRI)。校准表现评估使用校准曲线和Hosmer-Lemeshow检验。临床实用性使用临床决策曲线分析法(Decision Curve Analysis,DCA)评价。5.于全体结节验证根据基于20%/30%/40%/50%和最大Youden指数所得出的阈值的影像组学列线图恶性风险(分别称为 ACR-rad20%/30%/40%/50%/max)进行细针穿刺(fine-needle aspiration,FNA)推荐,评估非必要FNA率。结果:1.训练组和验证组在临床、病理及超声特征比较中差异均不显著(p>0.05),其中两组恶性结节比例分别为62.9%和70.6%(198/315 vs.96/136,p=0.114)。训练组中,恶性结节的Rad-Score显著高于良性结节(1.265[0.738-1.900]vs.-0.005[-1.955-0.910],p<0.001),验证组中 Rad-Score 差距依然显著(1.177[0.355-1.845]vs.-0.320[-2.182-0.685],p<0.001)。2.Rad-Score具有优秀的诊断效能,训练组AUC为0.801(95%CI 0.750-0.851),验证组为 0.820(95%CI 0.742-0.898)。3.训练组和验证组中,ACR-Rad列线图的AUC分别达到0.877(95%CI 0.836-0.919)和 0.864(95%CI0.799-0.931),显著高于 ACR-Score(p<0.001和0.031)。并于两组,列线图均有良好的校准表现。DCA表明,列线图具有临床应用价值。4.ACR-Rad列线图的AUC均显著高于高级医师和初级超声医师分别评得ACR TI-RADS得分,NRI和IDI均显示列线图对于不同熟练程度的超声医师诊断有显著改善(p<0.001)。5.当应用 ACR-rad50%来推荐 FNA 时,与 ACRTI-RADS 相比,ACR-Rad列线图显示出更高的特异性、准确度和阳性预测值,并降低了不必要FNA率。结论:基于超声图像的影像组学是一个准确的甲状腺良恶性结节诊断工具。列线图作为一个直观结合影像组学和ACR TI-RADS指南的工具,可以准确预测恶性甲状腺结节和降低不必要FNA率,并且对于高级和初级超声医师预测能力均有稳定的提高。