人工智能辅助胃癌病理诊断的初步研究

来源 :天津医科大学 | 被引量 : 0次 | 上传用户:camelwin2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究目的:全切片数字化图像(whole-slide images,WSIs)的出现以及快速发展的计算机视觉算法的发展使得人们对人工智能(artificial intelligence,AI),尤其是基于深度学习(deep learning,DL)的AI在病理学中的应用越来越感兴趣。目前AI尤其基于DL方法的AI在病理诊断中的研究主要集中在乳腺癌、前列腺癌、肺癌和结直肠癌等,对于胃癌诊断的研究相对较少。本研究拟通过大样本图像分析建立基于DL的AI模型,探索其用于胃癌原发灶及淋巴结转移病理辅助诊断的可行性。研究方法:1.建立数据集,并设定图像的标签真实值(ground truth,GT)1.1在获取胃印戒细胞癌数据集时,我们通过显微镜下人工直接采集的方式从72例本院胃印戒细胞癌原发灶标本中获得400×的GT“癌”和“非癌”图像。为了更加细致地学习印戒细胞癌的细胞学形态,本研究模型采用224×224像素的图块处理胃印戒细胞癌数据集。1.2在获取多亚型胃癌数据集时,我们通过先数字化扫描获取WSIs,再截取的方式从125例本院多亚型胃癌原发灶标本中获得了400×的GT“癌”和“非癌”图像。另外,为观察模型对不同组织处理方式的图像的适应能力,我们在癌症基因组图谱(The Cancer Genome Atlas,TCGA)胃癌冰冻图像数据库中通过先放大再截取的方式从98例多亚型胃癌WSI中获得400×的GT“癌”和“非癌”图像。为了能够包含更多的组织成分,本研究模型采用512×512像素的图块处理多亚型胃癌数据集。1.3在获取胃癌淋巴结数据集时,我们同样分别通过镜下直接截取和先数字化扫描再截取的方式获得了400×的淋巴结未转移图像和100×的淋巴结转移图像,GT分别为“非转移”和“转移”。为了能够包含更多的组织成分,本研究模型采用512×512像素的图块处理胃癌淋巴结数据集。1.4值得注意的是,为增强模型识别组织的泛化能力,我们在多亚型胃癌数据集加入了胃癌淋巴结未转移图像(GT为“非癌”),同时在胃癌淋巴结数据集中加入了本院和TCGA多亚型胃癌原发灶的癌和非癌图像(GT为“非转移”)。2.分布训练集和测试集从各数据集中随机抽取一些图像作为各自数据集的训练集,剩余图像则作为各自数据集的测试集。训练集图像供DL模型学习不同GT图像的特征,测试集图像用来评估DL模型的诊断性能。训练和验证模型。3.图像预处理根据不同数据集中不同的图像环境和不同的学习需求,确定DL模型每次所要处理的图块的大小。4.训练和测试模型首先利用胃印戒细胞癌训练集的图像建立以卷积神经网络为架构的AI模型,接着在胃印戒细胞癌测试集中进行测试。然后加入多亚型胃癌训练集数据继续训练,随后在多亚型胃癌测试中测试。最后进行胃癌淋巴结转移/非转移的训练,并进行测试。5.统计分析使用SPSS17.0软件进行统计学分析。通过比较测试集中图像的模型预测值和各图像的GT来评估模型诊断的准确率、灵敏度、特异度、阳性预测值、阴性预测值、Youden指数、F1-分数、Kappa系数和AUC等指标。研究结果:1.各数据集中不同GT图像的分布1.1胃印戒细胞癌数据集(本院,72例,1554张,400×):包括癌图像933张(GT“癌”)、非癌图像621张(GT“非癌”)。1.2多亚型胃癌数据集(本院+TCGA,4329张,400×):(1)本院多亚型胃癌125例,包括癌图像1225张(GT“癌”)、非癌图像958张(GT“非癌”);(2)TCGA多亚型胃癌98例,包括癌图像793张(GT“癌”)、非癌图像637张(GT“非癌”);(3)本院胃癌未转移淋巴结134例,图像716张(GT“非癌”)。1.3胃癌淋巴结数据集(本院+TCGA,共4991张):(1)本院胃癌转移淋巴结61例,图像662张(GT“转移”,100×);(2)胃癌未转移淋巴结134例,图像716张(GT“非转移”,400×);(3)本院+TCGA多亚型胃癌原发灶的癌和非癌图像3613张(GT“非转移”,400×)。2.训练集和测试集的数据分布2.1胃印戒细胞癌数据集中,GT“癌”的训练集795张(85.2%)、测试集138张(14.8%),GT“非癌”的训练集498张(80.2%)、测试集123张(19.8%)。2.2多亚型胃癌数据集中,GT“癌”的训练集2002张(99.2%)、测试集16张(0.8%),GT“非癌”的训练集2263张(97.9%)、测试集48张(2.1%)。2.3胃癌淋巴结数据集中,GT“转移”的训练集646张(97.6%)、测试集16张(2.4%),GT“非转移”的训练集4265张(98.5%)、测试集64张(1.5%)。3.DL模型诊断胃癌原发灶的探索3.1本研究模型可以在图块水平对印戒细胞癌数据集进行癌/非癌的预测,准确率、灵敏度、特异度和AUC分别为97.5%、97%、97.9%和0.995,漏诊和误诊率分别为3%和2.1%。通过对漏诊、误诊病例的分析,提示我们在今后的AI模型完善中需要进一步强化学习印戒细胞癌独特且多样化的形态,并与血管内皮细胞、浆细胞、组织细胞和纤维母细胞等非肿瘤性细胞鉴别。3.2该模型也可以在图像水平对多亚型胃癌数据集进行癌/非癌的预测,准确率、灵敏度、特异度和AUC分别为90.6%、93.3%、89.8%和0.943,漏诊和误诊率分别为6.7%和10.2%。漏诊的病例需加强在核异型性较小的低黏附性癌中的训练;误诊的病例还应进一步训练模型识别非癌组织。同时还应注意图像标注的准确性。4.DL模型诊断胃癌淋巴结转移的探索4.1本研究模型可以在图像水平对胃癌淋巴结数据集进行转移/非转移的预测,准确率、灵敏度、特异度和AUC分别为83.8%、100%、79.7%和0.964,漏诊和误诊率分别为0%和20.3%。虽然目前模型诊断胃癌淋巴结转移的敏感性很好(100%),且能识别孤立性肿瘤细胞,但测试集数据量小(仅16张淋巴结转移图像),应该扩大样本量进一步评估。4.2对于误诊的病例,我们还需强化训练模型鉴别转移癌(尤其低分化癌)和窦组织细胞、血管内皮细胞等非肿瘤细胞的能力。另外,假阳性病例中还存在一部分原发灶图像中同时包含癌(样)组织和淋巴组织(6/13),这可能与转移淋巴结图像在模式上相似,导致了模型的误诊。但也初步显示了模型如何识别淋巴结转移(即需要淋巴组织和癌组织同时存在)。研究结论:1.本研究在胃癌原发灶中针对临床容易漏诊、误诊的胃印戒细胞癌这一特殊亚型建立了基于DL的AI模型。该模型亦能应用于多亚型胃癌,且能够同时适应福尔马林固定、石蜡包埋的切片和冰冻切片,具有广泛的应用前景。另外,该模型也可辅助胃癌淋巴结转移病理诊断,证实了其在胃癌原发灶和转移灶检测中的的兼容性,便于临床应用。2.以后我们将通过更大样本量、更多样本类型、不同的放大倍数的图像进一步训练模型,通过改善数据标注加强与非肿瘤性细胞和组织的鉴别,以及在多中心、前瞻性研究中对模型进一步评估。
其他文献
常压等离子体具有不需要真空系统、可实现连续生产、节能环保等优点,在聚合物材料表面改性方面具有很好的应用前景。作为一种重要的聚合物材料,聚酯纤维及其制品广泛的用于生
土壤源热泵技术利用浅层地热能进行供热和制冷,具有清洁、高效,稳定的特点。在进行热泵系统设计时,往往将土壤作为等效的均匀介质进行地埋管换热器的设计计算,忽略了地质环境的影响。基于实际的地质分层状况,在多孔介质传热理论的基础上,本文建立了考虑地下水渗流的分层地埋管换热器数值模型,计算了地埋管换热器中U型管内的水温分布特性,地埋管换热器周围土壤的温度分布及其换热特性,分析了岩土轴向分层和地下水渗流对地埋
随着科技的不断发展,图像渐渐成为生活中主要的信息载体,图像数量呈现爆炸性增长,但现在的计算机对图像的处理速度并不能跟上其数量的增长速度。我们希望机器能够像人一样准
泡沫浮选是矿物加工行业中广泛使用的一种绿色分离方法,可有效回收水溶液中的表面活性物质。而对于在有机溶剂体系中浮选回收纳米颗粒的研究还未见任何文献报道。本文主要目的在于研究不同有机体系的泡沫性能和应用于纳米颗粒的回收工艺,并开发了有效分离方法。首先,研究了不同种类表面活性剂在不同极性的有机液体系中的泡沫性能。碳氢类的表面活性剂在非极性有机溶剂中不能形成泡沫。与碳氢类的表面活性剂相比,氟碳表面活性剂在
目的:评估腹主动脉瘤(AAA)近端瘤颈解剖条件与主动脉腔内修复术(EVAR)治疗结果间的相关性,探索AAA行EVAR治疗的解剖适应症。方法:收集2013年1月至2018年12月于天津医科大学总医院血管外科行EVAR治疗的361例AAA患者的临床及影像学资料,根据术前近端瘤颈解剖情况分为复杂组与非复杂组。回顾性、对比性分析两组术前基础情况、术中器械释放成功率和手术成功率、术中和围术期及随访期并发症发
研究背景十八届五中全会决定全面实施二胎政策以来,众多省份均已启动二胎政策。随着政策的改革和人们思想的改变,选择生二胎的家庭越来越多。任何事物都有其两面性,二胎政策虽然激发了家庭的生育热情,但是二胎政策的放开也引发了女性工作相关压力、经济收入、住房条件、子女教育、时间精力、抚养成本、医疗服务等一系列现实问题。面对大家迫切的生育意愿,如何减少孕育第二个孩子所带来的矛盾,让大家零压力地响应国家二胎政策,
煤炭等化石能源的利用对环境造成污染,将煤炭经合成气(H2+CO)合成低碳醇(HAS)是煤炭洁净利用的可能途径之一,颇具应用前景。低温CO氧化不仅可以用做空气净化、燃料电池以及汽车尾气处理等方面,也常被用做探针反应测试催化剂的性能,具有重要的实际和理论研究意义。以钙钛矿为催化剂前驱体制备30 wt.%La Co0.7Cu0.3O3/SiO2,还原后得到CuCo-Alloy,在浆态床反应器中用于合成气
随着我国城市化进程的快速发展,城市配送规模逐年递增,优化城市配送网络将带来巨大的经济效益。第三方物流资源整合能力不足的缺点日益凸显,开展第四方物流车辆路径问题研究,既能整合物流资源,又可以优化配送路径,进一步提高配送效率,降低配送成本,改善城市交通状况。基于行业创新模式提出客户资源整合和配送中心资源整合的两种第四方物流车辆配送方案,将方案分别描述为不同的车辆路径问题:客户分组下多配送中心闭合的车辆
VOCs能引起光化学烟雾和城市雾霾,已经成为一个影响大气环境质量的重要因素,VOCs治理与减排刻不容缓。生物技术和臭氧氧化技术被应用于VOCs处理过程中,具有一定的应用价值,存
众所周知,我们人类的眼睛每天都会接收大量的视觉信息,凭借着我们高效的视觉注意系统,我们可以对接收而来的大量视觉信号进行选择与过滤,删除其中冗余的部分,将最重要的信息