论文部分内容阅读
随着深度学习技术不断的发展,卷积神经网络在各种复杂视觉挑战任务下都表现出了较好的性能,这使得以深度学习为基础,建立一整套的计算辅助诊断技术的目标变为了可能。与人工诊断相比,使用计算机辅助技术进行诊断具有成本低、效率高的特点。而医学领域中计算机诊断技术,往往对模型的准确度有着极高的要求。医学图像的分类按照数据类别大致可以分为2维图片分类和3维图片分类两种。在2维度图片分类的问题上,已经有很多不同的研究。为了提升网络的拟合能力,大多使用了多分枝的结构,要么是单枝网络、不同分辨率数据集形式,要么是多分支网络、单一数据集形式。这样导致了网络的结构臃肿,网络训练速度过慢,其次,传统的卷积神经网络大多使用最后一层的输出特征信息进行分类,忽略了对网络低层次语义信息的利用。本文针对医学图像中存在病灶区域小,正负样本区分度不明显的问题,设计了一种递进式的多尺度信息融合机制,并结合自然图像分类中的注意力机制,对现有的卷积神经网络结构进行改进,建立了端到端的图像自动识别模型。本文做的主要工作如下:利用残差神经网络中的跨层连接结构来进行网络的构建,对常见的分类网络的结构和效果进行了深入的研究。并分析了卷积神经网络中网络退化的现象产生的原因。使用跨层连接的方式可以避免网络退化现象的发生,使得搭建层数较大的卷积神经网络模型这一任务成为了可能,参数量和非线性变换的增多有助于网络泛化能力的提升,提高模型的准确度。同时参考了卷积神经网络中常见的优化方法,使用批归一化和1*1卷积的方式提高的网络收敛的速度。通过基于人体视觉系统建立的注意力机制可以对模型进行改进。在注意力机制中,首先对原特征图内的语义信息进行压缩,然后以前馈神经网络的结构对原特征图不同通道之间的相互关系进行运算,利用运算出的权重向量对原特征图进行调整,新的特征图中不同的局部特征所占的比重发生可变化,网络对关键区域的关注度得到提升,且注意力机制具备不改变网络输入维度的特点,可以在卷积神经网络中进行灵活的应用。针对多尺度特征融合中低层次语义信息利用问题、融合策略有效性问题、下采样信息丢失问题提出了相应的解决方案。首先以扩大化的跨层连接的方法对网络不同层次的语义信息进行融合,增加了对网络低层次信息的利用。然后对网络的层次进行划分,针对网络不同的层次,设计了不同的融合方案。最后在下采样的过程中使用了最大池化,选取池化区域中更具有意义的元素。结合三个问题设计了最终的多尺度信息融合机制本文以网络的层数、是否使用注意力机制、是否使用多尺度特征融合机制以及二则是否同时使用为基准设置了不同的对照。使用精度、查准率、查全率及F1值不同的评价指标对网络整体的性能进行描述。最优情况下网络的精度可以达到94.45%。实验结果证明了改进后的模型在时间和空间复杂度上的优越性以及本文使用的注意力机制和多尺度信息融合机制对浸润型肺结核图像识别任务准确率的提升性。同时对实验结果中一些有偏差的的数据进行分析,结合网络的结构对这些数据产生的原因进行探究。