论文部分内容阅读
随着计算机软硬件基础设施的发展,以及社会的日益数字化驱动所带来的海量数据的积累,使得以数据驱动为基础的深度学习的研究迅速发展。同时,在医学影像领域,随着医学成像技术的发展,日益精细化的医学影像能够提供大量有价值的信息,帮助医生对疾病做出更准确的诊断。乳腺癌在女性群体中是发病率最高、死亡率最高的癌症。早期发现和治疗可以有效降低乳腺癌死亡率,而乳腺超声检查作为有效的检查手段,也在大多数国家和地区被广泛运用。自动乳房三维容积超声扫描检查作为新兴医疗诊断技术,可以自动扫描整个乳房并生成三维图像,医生在标准化的图片平台既可以随时查看病人的影像,有效的提升了早期乳腺癌的检出率。然而,医疗资源在很多国家和地区的严重匮乏且分配不均衡,最终的诊断结果严重依赖于医生的主观经验,且完整的诊断需要耗费大量时间。本研究以医院提供的临床高质量乳腺三维容积超声数据作为基础,基于深度学习的注意力机制构建一个计算机自动乳腺病灶识别的模型,为进一步的乳腺癌计算机自动诊断/筛查提供关键的支撑。相比传统的二维影像的研究,本研究处理的是三维影像。根据问题的特点,本研究主要从单个数据样本大、目标体积非常小的角度分析。针对三维容积影像单个样本体积大,受医生临床的诊断过程的启发,提出了“基于注意力机制的三维影像目标检测两阶段模型3DMS A-CNN”作为整体框架。针对乳腺癌存在大量小病灶的情况,提出了“基于三维卷积的多尺度病灶检测与定位”模型。为了降低目标识别的假阳性率,提高恶性病灶识别的敏感性,提出了“基于三维卷积神经网络的病灶细分类”模型。基于三维卷积的多尺度病灶检测与定位模型作为第一阶段,通过将输入的影像进行多尺度特征提取,并通过插值将多级特征进行融合,提高了浅层特征的语义表达能力。为了提高对不同尺度病灶的检测能力,采用了密集的候选框检测。并采用Focal Loss损失函数,解决了由于密集候选框导致的正负样本极度的不平衡的问题。由于计算机硬件的限制,在模型实现过程中,将数据在输入模型之前进行了池化层降采样。为了提升模型整体的泛化能力,将Batch Norm层修改为多GPU同步模式,并将模型由单精度浮点改为半精度浮点。基于三维卷积神经网络的病灶细分类模型作为第二阶段,通过第一阶段预测的疑似候选区域,从原始影像中获取对应的区域,进行进一步的细分类。通过优化实现3D DenseNet,实现了显存的高效利用,提升了模型的单个批次的训练样本数。同时,为了提升模型泛化能力,使用“mixup”算法进行了数据增强,有效提升了第二阶段的模型泛化能力。具体实验中,使用由医院提供的3012名患者经过标注的ABUS影像文件,其中2479名患者的影像文件中包含一个到多个病灶标记。随机选取包含病灶标记的2245名患者作为训练样本,767名患者的数据作为测试集。使用Pytorch深度学习框架实现3DMS A-CNN模型,经过充分的实验,最终模型对病灶的敏感性达到了91.62%,特异性达到了85.20%,初步满足了临床应用的需求。