论文部分内容阅读
第一部分以超声特征为基础的甲状腺结节恶性风险预测模型的建立与验证目的:构建以超声特征为基础的甲状腺结节恶性风险预测模型并进行验证;方法:建立甲状腺结节患者队列,前瞻性收集患者的人口学、生化检查、超声、病理等基线特征,将队列随机分为发现队列和内部验证队列,外部验证队列由北京协和医院和北京同仁医院甲状腺结节超声数据库组成,在发现队列中使用单变量Logistic回归及根据文献报道筛选出与甲状腺癌相关的指标,使用多变量Logistic回归建立预测甲状腺癌恶性风险的回归方程,并建立评分系统,同时分别在内部、外部验证队列中对模型诊断表现进行验证,使用ROC曲线下面积评价模型的区分度,使用Hosmer-Lemeshow拟合优度检验评价模型校准度。结果:(1)发现队列包括1183个甲状腺结节,其中男性233例,女性950例,平均年龄46.1±13.2岁,结节平均大小1.96±1.05cm,良性甲状腺结节1027个,恶性甲状腺结节156个,内部验证队列由1150个甲状腺结节组成,其中良性结节1007个,恶性甲状腺结节142个,男性192例,女性958例,平均年龄46.0±13.0岁,平均结节大小1.94土 1.00cm,外部验证队列纳入392个甲状腺结节,其中良性甲状腺结节68个,恶性甲状腺结节324个,男性86例,女性243例,平均年龄43.8±10.1岁。(2)单变量Logistic回归显示性别、年龄、病程、结节数量、结节性质、回声、纵横比、粗大与环型钙化、微小钙化、边缘不清、边缘毛糙或微分叶、甲状腺外侵犯、颈部可疑淋巴结等与甲状腺结节恶性风险呈显著相关,最终多变量预测模型纳入性别[OR2.191,95%CI(1.266,3.793),p=0.005]、年龄[0.971,(0.953,0.990),p=0.002]、多发结节[0.478,(0.298,0.766),p=0.002]、结节性质[2.712,(1.751,4.200),p<0.001]、回声[1.603,(1.035,2.481),p=0.034]、纵横比[1.881,(0.990,3.571),p=0.054]、结节钙化[粗大及环型钙化 2.264,(0.954,5.375),p=0.064,微钙化4.432,(2.675,7.343),p<0.001]、边缘[不清 1.241,(0.943,2.072),p=0.078,毛糙或微分叶 25.613,(4.885,134.290),p<0.001]等预测因子。同时我们根据回归系数建立甲状腺结节恶性风险预测模型评分系统TNScore。(3)内部验证显示新模型TNScore具有良好预测表现,ROC曲线下面积为0.845(95%可信区间0.823-0.866,p<0.001),同时有良好的校准度,Hosmer-Lemeshow拟合优度检验卡方值7.188(p=0.516);外部验证显示TNScore应用于外部验证队列的ROC曲线下面积为0.948[95%CI(0.920-0.968),p<0.001],Hosmer-Lemeshow 拟合优度检验卡方值 3.641(p=0.820)。结论:我们成功建立甲状腺结节队列,以甲状腺结节超声特征为基础,结合其他临床特征,构建了甲状腺结节恶性风险预测模型TNScore,经内部与外部验证新模型具有良好的普适性与校准度,可用于预测甲状腺结节恶性风险概率。第二部分新模型TNScore与2015年ATA指南与2017年ACR TI-RDAs预测模型的比较研究目的:对新建立的甲状腺结节恶性风险预测模型TNScore与2015年ATA指南与2017年ACR TI-RDAs预测模型的诊断表现进行比较。方法:在厦门大学附属第一医院队列及北京协和医院、北京同仁医院队列分别进行比较新模型与2015年ATA指南与2017年ACR TI-RDAs甲状腺结节超声恶性风险预测模型的诊断表现。使用AUC曲线下面积、敏感性、特异性评价模型诊断的区分度,使用再分类指数评价模型的校准度,使用决策曲线分析评价模型的临床净获益。结果:(1)厦门队列纳入2333个甲状腺结节,其中良性结节2034个,恶性甲状腺结节298个,男性425例,女性1908例,平均年龄46.0±13.1岁,平均结节大小1.95±1.02cm,北京协和医院及北京同仁医院超声数据库为外部队列(见第一部分)。(2)在厦门队列中,新模型TNScore诊断甲状腺癌的敏感性为66.90%,特异性为 87.83%,AUC 曲线下面积为 0.845[95%CI(0.823,0.866),p<0.001]。ATA模型诊断甲状腺癌的敏感性67.13%,特异性76.88%,AUC曲线下面积为0.751[95%CI(0.725,0.776),p<0.001];ACR TIRADS 模型诊断甲状腺癌的敏感性 53.15%,特异性 93.48%,AUC 曲线下面积为 0.815[95%CI(0.791,0.837),p<0.001];TNScore与ATA及ACRTIRADS模型相比,AUC曲线下面积差异分别为 0.0941[95%CI(0.0513,0.137),p<0.001]及 0.0313[95%CI(0.0024,0.0602),p=0.034]。在模型校准度方面,与ATA模型相比,TNScore的绝对再分类指数(NRI)为 3.2%,增加 NRI 为 15.0;与 ACR TIRADS 模型相比,TNScore 绝对NRI为4.7%,增加NRI为8.8。在临床净获益方面,决策曲线分析发现TNScore模型的临床净获益亦优于二者。(3)在北京队列中TNScore诊断甲状腺癌的敏感性为89.59%,特异性为92.06%,AUC 曲线下面积为 0.950[95%CI(0.922,0.969),p<0.001]。与 2015 年 ATA指南及2017 ACR TIRADS系统相比,TNScore模型在诊断甲状腺癌区分度优于二者。AUC曲线下面积差异分别为0.0350(0.0134,0.0566,p=0.001)及0.0303(0.0040,0.0566,p=0.0238),在模型校准度方面,与二者相比,新模型的绝对再分类指数(net reclassification index,NRI)分别为 5.1%,3.6%,增加 NRI 分别为 13.2,7.6。结论:我们的新模型TNScore在诊断表现优于2015年ATA指南、2017年ACR TIRADS甲状腺结节恶性风险预测模型。