论文部分内容阅读
通过计算机辅助分析更好地解释影像是医学影像领域长期存在的问题。在影像理解方面,机器学习取得的最新进展有助于识别、检索和分割医学影像。深度学习的核心是从数据中学习分层特征表示,而不是基于特定领域知识设计的手工特征。通过这种方式,深度学习迅速被证明是最有效的方法,并在各种医学应用中获得更好的性能。本文针对“CT肺结节影像检索和数字病理影像分割”所涉及的相关技术进行阐述。基于内容的医学影像检索(CBMIR)系统能从历史案例中发现各种疾病诊断和治疗的有效方法,同时还是处理大量数据的高效管理工具。医学影像分割旨在自动提取器官边界特征,减少搜索的空间,提高影像检索的效率。本文对影像检索和分割的研究主要包括以下几点:(1)由于医学影像收集困难,大部分研究人员都将问题的研究集中在迁移学习上,但这些方法往往都忽视了医学影像的一些固有特征。本文在大型公开挑战赛上收集200+GB的CT肺结节影像,利用医学领域知识做好数据预处理,制作数据集,利用深度学习框架直接在医学影像上训练模型。(2)本文通过对InRes-Net中FC2层的改进,模型能同时学习影像特征和哈希函数,实现了深度学习技术对CT肺结节影像特征的自动提取及编码。(3)本文采用“粗略+精细”的检索策略,得到高效的CT肺结节影像检索系统。(4)高分辨率数字病理影像提供关于生物系统的形态学和功能特征等丰富信息,但单幅影像尺寸超过了150,000×150,000。本文使用Patch Sampling技术对原始数据采样,解决了训练数据尺寸极大的问题,同时还增加了训练样本。(5)针对数字病理影像复杂的临床特征,本文使用不同特征层上的全局感受野卷积网络(GICN)结构组成了多级(multi-level)特征金字塔,化解了分类和定位之间的矛盾;不同尺寸的全局平均池化结构组成了多尺度(multi-scale)特征金字塔,有利于整合不同大小和区域的上下文信息。本文针对CT肺结节影像特点提出对应的解决思路,最后在检索系统上获得0.73的平均精度。由于CT肺结节影像没有掩膜标签,不满足训练分割模型的条件,最终选择在一组有标注的数字病理影像上训练模型,分割精度为0.63,比之前方法提高10%以上。通过以上实验验证了本文所提算法的有效性。