论文部分内容阅读
目前,卷积神经网络模型已经被广泛应用于完成各类智能任务,例如:人脸识别、文字识别、证件/车牌识别等。其解决计算机视觉问题的强大能力已在在多个自然场景任务中得到了验证。医学影像辅助诊断场景是一个复杂的场景,涉及多种类型的图像。其中包括:普通二维图像(例如:眼底图像,皮肤图像),超大分辨率图像(例如:数字病理切片图像)和三维影像(例如:CT、MRI)。该领域还有许多问题有待研究,例如:是否能够迁移已有的成功模型处理不同类型的医学图像并得出正确的诊断结论;模型处理能力是否能达到临床使用要求等。本文总结了卷积神经网络在医学影像诊断模型设计领域的研究进展,针对适配不同的数据格式、迁移已有的模型、特定应用场景优化、平衡模型的速度、精度、可解释性等指标,提高模型的可用性等问题展开研究。提出了一种普通二维医学图像数据处理方法,并针对糖尿病视网膜病变检测场景构建了 Trans-DRNet模型。该模型借鉴了医生的实际诊疗过程,通过两级卷积神经网络完成了对双眼特征的有效融合,更好的表征了疾病的严重程度。另外,在模型求解过程中分析了不同求解方法的优劣,阐述了不同求解方法的适用场景。实验表明,该模型具备较强的病变图像分类能力。提出了一种超大分辨率医学图像数据处理方法,并针对乳腺癌前哨淋巴结转移检测场景构建了Trans-TumorNet模型。该模型结合了微观尺度上的卷积神经网络与宏观尺度上的形态学计算,构建了肿瘤区域信息提取的完整链条,具备较强的肿瘤图像分类能力。另外,针对如何平衡模型效率、模型性能和模型可解释性,本文通过细致观察医生阅片的过程,提出了能够利用多分辨率特征的MMFE方法用于对Trans-TumorNet模型的改进,并取得了良好的效果。提出了一种三维医学影像数据处理方法,并针对早期肺癌筛查场景构建了 Trans-LungNet模型。该模型利用两个结构完全不同的卷积神经网络分别提取结节特征和特殊组织特征,完成了对三维影像的结构化处理。实验表明,该模型具备较强的三维图像分类能力。另外,在时间维度拓展方面,本文通过提出Trans-USNet模型探索了物体检测模型在乳腺超声结节检测场景下的应用。该模型通过对问题的分解,将结节检测和结节分类分为两个阶段分别处理,兼顾了视频处理对速度的要求和临床诊断对精度的要求。实验表明该模型能够高效处理视频数据,具备较强的结节检测和分类能力。提出了一种卷积神经网络模型可用性改进的一般方法。本文指出可用性改进需要提高模型的可解释性和易用性。对于模型的可解释性改进,提出了利用基于分类梯度映射,标记出显著影响诊断结果的特征来源区域的方法。对于模型易用性改进,提出了利用WebService和异步消息队列,将模型封装为服务的方法。同时,为了验证该方法可有效性,本文利用这一方法对Trans-DRNet模型进行了改进,通过可解释性改进和易用性改进分别创建了报告系统和移动应用,获得了良好的效果。综上所述,本文基于对卷积神经网络性质的研究,提出了针对多种类型医学图像数据的处理方法,并针对多个典型场景进行了深入分析与建模实践。指出了利用卷积神经网络构建具体模型时所需要考虑的各方面的因素,并探索了不同图像数据结构下模型构建的共性过程。本文提出的模型构建与改进方法具有较强的通用性,对未来更大范围的医学图像建模工作具有积极的指导意义。