论文部分内容阅读
研究目的:全切片数字化图像(whole-slide images,WSIs)的出现以及快速发展的计算机视觉算法的发展使得人们对人工智能(artificial intelligence,AI),尤其是基于深度学习(deep learning,DL)的AI在病理学中的应用越来越感兴趣。目前AI尤其基于DL方法的AI在病理诊断中的研究主要集中在乳腺癌、前列腺癌、肺癌和结直肠癌等,对于胃癌诊断的研究相对较少。本研究拟通过大样本图像分析建立基于DL的AI模型,探索其用于胃癌原发灶及淋巴结转移病理辅助诊断的可行性。研究方法:1.建立数据集,并设定图像的标签真实值(ground truth,GT)1.1在获取胃印戒细胞癌数据集时,我们通过显微镜下人工直接采集的方式从72例本院胃印戒细胞癌原发灶标本中获得400×的GT“癌”和“非癌”图像。为了更加细致地学习印戒细胞癌的细胞学形态,本研究模型采用224×224像素的图块处理胃印戒细胞癌数据集。1.2在获取多亚型胃癌数据集时,我们通过先数字化扫描获取WSIs,再截取的方式从125例本院多亚型胃癌原发灶标本中获得了400×的GT“癌”和“非癌”图像。另外,为观察模型对不同组织处理方式的图像的适应能力,我们在癌症基因组图谱(The Cancer Genome Atlas,TCGA)胃癌冰冻图像数据库中通过先放大再截取的方式从98例多亚型胃癌WSI中获得400×的GT“癌”和“非癌”图像。为了能够包含更多的组织成分,本研究模型采用512×512像素的图块处理多亚型胃癌数据集。1.3在获取胃癌淋巴结数据集时,我们同样分别通过镜下直接截取和先数字化扫描再截取的方式获得了400×的淋巴结未转移图像和100×的淋巴结转移图像,GT分别为“非转移”和“转移”。为了能够包含更多的组织成分,本研究模型采用512×512像素的图块处理胃癌淋巴结数据集。1.4值得注意的是,为增强模型识别组织的泛化能力,我们在多亚型胃癌数据集加入了胃癌淋巴结未转移图像(GT为“非癌”),同时在胃癌淋巴结数据集中加入了本院和TCGA多亚型胃癌原发灶的癌和非癌图像(GT为“非转移”)。2.分布训练集和测试集从各数据集中随机抽取一些图像作为各自数据集的训练集,剩余图像则作为各自数据集的测试集。训练集图像供DL模型学习不同GT图像的特征,测试集图像用来评估DL模型的诊断性能。训练和验证模型。3.图像预处理根据不同数据集中不同的图像环境和不同的学习需求,确定DL模型每次所要处理的图块的大小。4.训练和测试模型首先利用胃印戒细胞癌训练集的图像建立以卷积神经网络为架构的AI模型,接着在胃印戒细胞癌测试集中进行测试。然后加入多亚型胃癌训练集数据继续训练,随后在多亚型胃癌测试中测试。最后进行胃癌淋巴结转移/非转移的训练,并进行测试。5.统计分析使用SPSS17.0软件进行统计学分析。通过比较测试集中图像的模型预测值和各图像的GT来评估模型诊断的准确率、灵敏度、特异度、阳性预测值、阴性预测值、Youden指数、F1-分数、Kappa系数和AUC等指标。研究结果:1.各数据集中不同GT图像的分布1.1胃印戒细胞癌数据集(本院,72例,1554张,400×):包括癌图像933张(GT“癌”)、非癌图像621张(GT“非癌”)。1.2多亚型胃癌数据集(本院+TCGA,4329张,400×):(1)本院多亚型胃癌125例,包括癌图像1225张(GT“癌”)、非癌图像958张(GT“非癌”);(2)TCGA多亚型胃癌98例,包括癌图像793张(GT“癌”)、非癌图像637张(GT“非癌”);(3)本院胃癌未转移淋巴结134例,图像716张(GT“非癌”)。1.3胃癌淋巴结数据集(本院+TCGA,共4991张):(1)本院胃癌转移淋巴结61例,图像662张(GT“转移”,100×);(2)胃癌未转移淋巴结134例,图像716张(GT“非转移”,400×);(3)本院+TCGA多亚型胃癌原发灶的癌和非癌图像3613张(GT“非转移”,400×)。2.训练集和测试集的数据分布2.1胃印戒细胞癌数据集中,GT“癌”的训练集795张(85.2%)、测试集138张(14.8%),GT“非癌”的训练集498张(80.2%)、测试集123张(19.8%)。2.2多亚型胃癌数据集中,GT“癌”的训练集2002张(99.2%)、测试集16张(0.8%),GT“非癌”的训练集2263张(97.9%)、测试集48张(2.1%)。2.3胃癌淋巴结数据集中,GT“转移”的训练集646张(97.6%)、测试集16张(2.4%),GT“非转移”的训练集4265张(98.5%)、测试集64张(1.5%)。3.DL模型诊断胃癌原发灶的探索3.1本研究模型可以在图块水平对印戒细胞癌数据集进行癌/非癌的预测,准确率、灵敏度、特异度和AUC分别为97.5%、97%、97.9%和0.995,漏诊和误诊率分别为3%和2.1%。通过对漏诊、误诊病例的分析,提示我们在今后的AI模型完善中需要进一步强化学习印戒细胞癌独特且多样化的形态,并与血管内皮细胞、浆细胞、组织细胞和纤维母细胞等非肿瘤性细胞鉴别。3.2该模型也可以在图像水平对多亚型胃癌数据集进行癌/非癌的预测,准确率、灵敏度、特异度和AUC分别为90.6%、93.3%、89.8%和0.943,漏诊和误诊率分别为6.7%和10.2%。漏诊的病例需加强在核异型性较小的低黏附性癌中的训练;误诊的病例还应进一步训练模型识别非癌组织。同时还应注意图像标注的准确性。4.DL模型诊断胃癌淋巴结转移的探索4.1本研究模型可以在图像水平对胃癌淋巴结数据集进行转移/非转移的预测,准确率、灵敏度、特异度和AUC分别为83.8%、100%、79.7%和0.964,漏诊和误诊率分别为0%和20.3%。虽然目前模型诊断胃癌淋巴结转移的敏感性很好(100%),且能识别孤立性肿瘤细胞,但测试集数据量小(仅16张淋巴结转移图像),应该扩大样本量进一步评估。4.2对于误诊的病例,我们还需强化训练模型鉴别转移癌(尤其低分化癌)和窦组织细胞、血管内皮细胞等非肿瘤细胞的能力。另外,假阳性病例中还存在一部分原发灶图像中同时包含癌(样)组织和淋巴组织(6/13),这可能与转移淋巴结图像在模式上相似,导致了模型的误诊。但也初步显示了模型如何识别淋巴结转移(即需要淋巴组织和癌组织同时存在)。研究结论:1.本研究在胃癌原发灶中针对临床容易漏诊、误诊的胃印戒细胞癌这一特殊亚型建立了基于DL的AI模型。该模型亦能应用于多亚型胃癌,且能够同时适应福尔马林固定、石蜡包埋的切片和冰冻切片,具有广泛的应用前景。另外,该模型也可辅助胃癌淋巴结转移病理诊断,证实了其在胃癌原发灶和转移灶检测中的的兼容性,便于临床应用。2.以后我们将通过更大样本量、更多样本类型、不同的放大倍数的图像进一步训练模型,通过改善数据标注加强与非肿瘤性细胞和组织的鉴别,以及在多中心、前瞻性研究中对模型进一步评估。