论文部分内容阅读
背景导管原位癌(Ductal carcinoma in situ,DCIS)的首选影像学检查手段是乳腺X线检查。个体化诊疗模式下,如何基于乳腺X线影像识别不同临床风险程度的DCIS,成为临床工作中亟需解决的问题。另外,受穿刺活检取样的限制导致部分经活检证实的DCIS患者在随后切除手术中发现病理学升级为浸润性病变,这对建立DCIS病理学升级的术前无创高效预测模型提出挑战。影像组学和深度学习能量化提取不同层次特征并成为乳腺影像领域的研究热点,而目前基于乳腺X线影像采用影像组学构建DCIS临床风险程度分类和病理学升级预测模型的效能和精度仍不足。目的1.对比分析不同风险程度DCIS的临床、X线表现,基于手工设计影像组学(Hand-crafted radiomics,HCR)、深度学习(Deep learning,DL)特征及临床影像特征构建不同临床风险程度DCIS的识别模型并探讨其应用价值。2.对比单纯性和病理学升级DCIS的临床、病理、X线表现并筛选与病理学升级有关的预测因素,提取HCR和DL特征并筛选出最优特征模型,基于预测因素、最优特征构建DCIS病理学升级预测的联合模型并探讨其应用价值。方法1.回顾性分析2015年1月至2022年11月期间在南方医科大学深圳医院经术后病理证实为DCIS的264个患者的临床、乳腺X线检查影像、病理资料,随机分为训练集176例、测试集88例。对DCIS病理组织学核级别,按发展为浸润性乳腺癌的风险程度分为低风险组(低-中核级别)和高风险组(高核级)。采用t检验或Mann-Whitney U检验、χ2检验或Fisher精确概率检验比较临床、影像资料在不同风险程度DCIS组间的统计学差异。通过自有程序完成微钙化的半自动检测、分割,进一步采取影像组学和深度学习技术分别提取微钙化的HCR特征、DL特征,经过单因素方差分析、Pearson相关性检验、LASSO回归完成特征筛选。采用支持向量机(Support vector machine,SVM)分类器,分别基于筛选后的HCR特征、DL特征及二者组合的深度影像组学(Deep learning radiomics、DLR)特征,以及临床影像特征、临床影像+HCR特征、临床影像+DL特征、临床影像+DLR特征,构建DCIS的风险分类识别模型。以最终病理结果为金标准,采用受试者操作特征(Receiver operating characteristic,ROC)曲线对模型效能进行评价,评价标准为曲线下面积(Area under the curve,AUC)、准确率、特异度,以确定最优效能的识别模型。2.回顾性分析2015年1月至2022年11月期间在南方医科大学深圳医院经穿刺活检病理证实为DCIS并随后接受切除手术的336个患者,随机分为训练集252例、测试集84例。对DCIS在最终手术中是否发现病理学升级为导管原位癌伴微浸润(Ductal carcinoma in situ with microinvasion,DCIS-MI)、浸润性乳腺癌(Invasive breast cancer,IBC),分为未升级组和病理学升级组。记录患者的一般临床资料、病理及免疫组化结果、乳腺X线影像表现,采用t检验或Mann-Whitney U检验、X2检验或Fisher精确概率检验比较临床、病理、影像资料在两组间的统计学差异。采用单因素和多因素logistic回归分析筛选临床、病理、影像特征中与DCIS病理学升级相关的独立预测因素。通过自有程序完成微钙化的半自动检测、分割,进一步采取影像组学和深度学习技术分别提取微钙化的手工影像组学HCR特征、DL特征,经过单因素方差分析、Pearson相关性检验、LASSO回归完成特征筛选。采用SVM分类器,分别基于筛选后的HCR特征、DL特征及二者组合的DLR特征构建DCIS病理学升级的预测模型,采用ROC下面积AUC值评价并确定其中的最优特征模型。另外基于独立预测因素构建临床-语义预测模型,构建临床-语义和DLR特征的联合模型并采用列线图可视化,采用ROC曲线和校准曲线来评价各模型对DCIS病理学升级的预测效能。Delong检验被用来比较模型间AUC值的差异,决策曲线分析被用来评价最优效能模型的临床运用价值。结果1.在训练集和测试集中,低风险、高风险DCIS组间淋巴结异常、BI-RADS分类、钙化形态和钙化分布具有统计学差异(P<0.05)。其中高风险组更常见:淋巴结增大,出现率分别为3.7%(4/108)、1.8%(1/57);大于BI-RADS 4A的分类结果,出现率分别为65.7%(71/108)、66.6%(38/57);细线或线样分支状微钙化形态,出现率分别为81.5%(88/108)、73.7%(36/57);线样或段样的微钙化分布,出现率分别为63.9%(69/108)、77.2%(44/57)。而低风险组更常见:粗糙不均质或不定形微钙化形态,出现率分别为42.4%(29/68)、41.9%(13/31);簇状分布,出现率分别为 42.6%(29/68)、54.8%(17/31)。特征提取过程共产生544个HCR特征、256个DL特征,经过筛选后获得36个高价值特征。在测试集中DL特征模型的识别效能(AUC=0.741,95%CI,0.697-0.795)高于 HCR 特征模型(AUC=0.657,95%CI,0.611-0.703),两者结合后的DLR模型在训练集、测试集中识别效能(AUC=0.895、0.901)均高于HCR或DL模型(P<0.00I)。在训练集基于DLR特征结合临床影像特征的联合模型识别效能(AUC=0.913、0.932)(P<0.001),准确率、特异度分别为84.9%、93.3%,在测试集中AUC为0.932(95%CI,0.893-0.979),效能均优于单类特征模型、临床影像+DL特征以及临床影像+HCR特征模型(P<0.001)。2.在训练集和测试集中,一般临床资料在未升级、病理学升级DCIS的组间比较中均无统计学差异。纳入的病理因素包括病灶直径、ER、PR、HER-2、Ki-67、粉刺样坏死以及组织学核分级在两组间比较均有统计学差异,在训练集、测试中病理学升级的DCIS患者更容易出现较大的病灶直径(中位数分别为21mm、23mm)、HER-2 阳性(出现率分别为 61.4%、62.7%)、Ki-67 阳性(出现率分别为51.3%、40.7%)、粉刺样坏死(出现率分别为72.7%、86.4%)以及高核级(出现率分别为70.3%、69.4%),未升级DCIS患者更容易出现较小的病灶直径(中位数分别为14mm、15mm)、ER 阳性(出现率分别为94.7%、92.0%)、PR阳性(出现率分别为92.6%、88.0%)以及低-中核级(出现率分别为63.8%、68.0%)。纳入的影像因素包括乳腺背景、钙化形态以及钙化分布,仅有钙化形态、分布在组间比较具有统计学差异,病理学升级的DCIS患者更常见细小多形或线样分支状(出现率分别为63.9%、66.1%)以及线样或段样分布微钙化(出现率分别为74.0%、76.3%),未升级DCIS患者更容易出现较小粗糙不均质或不定形(出现率分别为64.9%、68.0%)以及簇状分布微钙化(出现率分别为60.6%、52.0%)。单因素logistic回归分析中,病灶直径≥20mm、细小多形或线样分支状钙化、线样或段样分布钙化、Ki-67≥14%、高核级别以及粉刺样坏死与DCIS病理学升级正相关(P<0.05),粗糙不均质或不定形、簇状分布的微钙化则与其负相关(P<0.05)。在多因素logistic 回归分析中,仅 Ki-67 ≥14%(OR=0.04,95%CI:0.0003-0.44;P=0.005)、高核级别(OR=0.44,95%CI:0.28-0.68;P<0.001)是 DCIS 病理学升级的独立预测因素。在测试集中基于DL特征的模型的预测效能AUC为0.743(95%CI,0.701-0.807)高于HCR特征的模型。采用影像组学提取的544个HCR特征、深度学习提取的362个DL特征,经过筛选后获得48个高价值特征集,两者结合后的DLR模型在测试集、训练集的AUC分别为0.899、0.905,均高于HCR、DL模型(P<0.001)。临床语义及DLR特征的联合模型,在训练集中,较单纯DLR、临床-语义模型的AUC分别提高了 3.2%、21.4%(0.928 vs 0.899、0.928 vs 0.764),测试集中分别提高了 2.8%、27.3%(0.931 vs 0.905、0.931 vs 0.731),联合模型对病理学升级DCIS的预测效能高于临床-语义模型、DLR模型(P<0.001)。决策曲线显示联合模型的临床价值高于临床影像、DLR模型,列线图显示DLR特征在联合模型中有最大预测权重。结论1.影像组学和深度学习结合的DLR特征联合临床影像特征构建的模型可有效识别不同风险程度DCIS,识别效能高于其他单类特征或两两混合的特征模型,可为解决术前无创评价DCIS的临床风险程度的问题提供新办法和新参考。2.影像组学和深度学习结合的DLR特征模型对DCIS病理学升级的预测效能高于单类特征模型,DLR特征加入临床独立预测因素构建的联合模型获得最佳识别效能,高于临床-语义、DLR特征模型,可为解决预测DCIS病理性升级以避免过度治疗和改善预后的问题提供新办法和新参考。