论文部分内容阅读
第一部分人工智能诊断系统在乳腺X线BI-RADS分类中的应用研究目的:评估基于全卷积单阶段神经网络的人工智能诊断系统在乳腺X线病灶BI-RADS 分类中 的应用 价值。方法:回顾性收集行乳腺X线检查并有病灶的556例患者,共609个病灶。由高、中、低年资三组医师及AI系统分别独立对病灶进行BI-RADS分类,以2名高年资医师达成一致的分类为参考标准,分别计算AI及中、低年资医师分类的一致性情况,并采用Kappa检验比较其分类的一致性。结果:609个病灶中,2名高年资医师达成一致的BI-RADS分类2类、3类、4A类、4B类、4C类及5类病灶数分别为99、169、120、74、75、72个。以此作为参考标准,AI及中、低年资医师BI-RADS分类的一致性分别为2类70.71%、98.99%、75.76%;3 类 78.11%、84.62%、73.96%;4A 类 55.83%、65.00%、45.00%;4B 类60.81%、68.92%、52.70%;4C 类 66.67%、74.67%、52.00%;5 类 79.17%、81.94%、62.50%,总的一致性分别为 69.13%、79.64%、61.90%。AI一致性中等(Kappa=0.633),中年资医师一致性较好(Kappa=0.752),低年资医师一致性中等(Kappa=0.531,P<0.001)。结论:基于卷积神经网络的人工智能诊断系统在乳腺X线BI-RADS分类中与高年资医师一致性中等,稍低于中年资医师,高于低年资医师,具有一定的临床应用价值。第二部分人工智能诊断系统在乳腺良恶性病变鉴别中的应用研究目的:评估基于全卷积单阶段神经网络的人工智能诊断系统在乳腺X线良恶性病变鉴别诊断中的应用价值。方法:回顾性收集乳腺手术患者共288例,术前均行乳腺X线检查。由AI系统及高、中、低年资三组医师分别独立对病灶进行乳腺良恶性病变鉴别诊断。以病理结果为金标准,计算AI及不同年资医师诊断乳腺良恶性病变的准确率、阳性预测值(PPV)、阴性预测值(NPV)。通过受试者工作特征(ROC)曲线分析AI系统与不同年资医师诊断乳腺良恶性病变的水平。采用X2检验,比较AI系统与不同年资医师诊断准确性的差异,并比较乳腺密度(非致密型、致密型)、病灶类型(肿块、非肿块病变)及病灶大小(肿块≤2cm、肿块>2cm)在AI及不同年资医师诊断中的差异,P<0.05为差异有统计学意义。结果:①288例患者中,良性病灶100个、恶性病灶188个。AI以及高、中、低年资医师诊断乳腺良性病变准确率分别为89.00%、94.00%、86.00%、73.00%;恶性病变准确率分别为84.04%、90.96%、86.70%、71.81%;阳性预测值分别为93.49%、96.61%、92.09%、83.33%;阴性预测值分别为 74.79%、84.68%、77.48%、57.94%。AI与高年资医师在良性病变中诊断准确性差异没有明显统计学意义(P>0.05),在恶性病变中诊断准确性差异有明显统计学意义(P<0.05);AI与中年资医师在良、恶性病变中诊断准确性差异均没有明显统计学意义(均P>0.05);AI与低年资医师在良、恶性病变中诊断准确性差异均有明显统计学意义(均P<0.05)。AI以及高、中、低年资医师诊断乳腺良恶性病变的AUC值分别为0.87、0.92、0.86、0.72。②对于不同乳腺密度,非致密型乳腺组中,AI以及高、中、低年资医师诊断乳腺病变准确率分别为87.04%、96.30%、90.74%、79.63%;在致密型乳腺组中诊断准确率分别为85.47%、91.03%、85.47%、70.51%。对于不同病灶类型,肿块病变中,AI以及高、中、低年资医师诊断乳腺病变准确率分别为86.93%、93.75%、86.93%、73.30%,非肿块病变中诊断准确率分别为83.93%、89.29%、85.71%、70.54%。对于不同病灶大小,小肿块病变中,AI以及高、中、低年资医师诊断乳腺病变准确率分别为89.17%、93.33%、87.50%、73.33%,大肿块病变中诊断准确率分别为80.36%、94.64%、87.50%、73.21%。在良、恶性病变中,对于不同乳腺密度、病灶类型及病灶大小,AI及高、中、低年资医师诊断准确性均无明显统计学意义(均P>0.05)。与中年资医师相比,AI在小肿块病灶中诊断准确性相对较高。结论:基于卷积神经网络的人工智能诊断系统在乳腺良、恶性病变鉴别诊断中的准确性较高,与中年资医师相当,并且不受乳腺密度、病灶类型的影响,在小病灶诊断中具有一定优势,具有极大的临床应用前景。