论文部分内容阅读
数字图像采集技术快速发展为构建有效的计算机辅助诊断系统(Computer-Aided Diagnosis,CAD)提供了坚实的基础。众所周知,构建一个有效的CAD系统能够很好的帮助医生对病人的疾病进行快速准确的判断。而本文中研究如何快速、准确的对医学图像进行分类是构建一个有效的CAD系统需要首先解决的一项关键性技术。近年来,大量的研究人员对CAD系统中医学图像自动分类问题进行了研究。但是仍然存在许多问题与不足,具体体现为:1)大量的研究都是利用传统特征结合分类器对医学图像进行分类,这样做的缺点是需要手工地对特征进行选取,并且选取的特征都是医学图像的浅层表示;2)医学图像数据集规模较小,单纯的训练一个深度网络,即使得到的是图像的深层次表示,但其多是图像的单尺度表示;3)许多利用深度神经网络对医学图像进行分类的研究都是在一种神经网络中完成的,训练多种不同类型神经网络集成对其分类研究较少;4)目前,大量对医学图像自动分类的研究都集中在图像的单特征空间或者其子空间结合分类器完成的,在图像多种特征空间及其子空间对医学图像分类的研究相对较少;5)许多情况下,医学图像数据集中图像的分辨率并不相同,为了对深度网络进行训练,大部分做法是对分辨率大小不一的图像直接缩放或裁剪到固定的分辨率,这样做会使得分辨率大小不一样的图像丢失图像信息,且丢失的程度不一致。针对以上问题与不足,本文进行了深入研究,取得的主要成果如下:1)提出了一个新模型对医学图像进行分类。该模型能够把一个编码网络提取的图像深度特征与统计特征结合起来对医学图像进行自动分类。本文认为,仅仅利用统计的特征(包括颜色、纹理、形状或者它们的一些组合)结合分类器来对医学图像进行分类,这些方法大部分都是具体的问题具体分析,而且这些特征只能对医学图像进行浅层表示。然而,深度学习的出现提供了一种端到端的模型对图像进行抽象,最终可以得到足够高层次的特征对医学图像进行抽象,但是模型的解释性不强。为了解决统计特征只能对医学图像进行浅层表示的问题以及提高深度模型的可解释性,设计了一种可以结合深度特征和浅层特征的算法来对医学图像进行分类。在数据集HIS2828和ISIC2017上对提出的算法进行了验证,其分类准确度分别达到了90.2%和90.1%,与其它算法相比,分别提升了4.5%和1.6%,证明了算法的有效性。2)提出了一种融合多尺度深度特征的算法对皮肤病理组织图像进行分类,以解决皮肤病理组织图像的分辨率较大之问题。如果单独训练一个深度卷积网络来对其进行分类需要对图像进行大幅度的缩放,因而会导致图像分类的准确度下降。该算法训练一个卷积神经网络作为编码网络,然后提取多层次深度特征,并将它们融合在一起以实现对皮肤病理图像的自动分类。最后,在Skin disease dataset(SDT)上对提出的算法进行验证,分类准确度达到了95.3%,与其它算法相比,提升了2.9%。3)提出了一个能够集成多种不同类型的深度神经网络对乳腺肿瘤医学图像进行分类的算法。为了增加集成算法的多样性以及提高分类算法的准确度,本文提出算法能够在医学图像的多种特征空间及其子空间进行集成。该算法集成了3种不同结构的深度神经网络(VGG16深度网络、(Network in Network)NIN深度网络、GoogLeNet网络),利这3种不同结构的网络提取乳腺肿瘤图像的多尺度深度特征并对其进行深层次的表示。这些表示能够相互补充,并在对应的实验中给出了验证。算法在数据集BreastCancer Histopathological Database(BreakHis)上对良性肿瘤和恶性肿瘤能够得到88.38%和86.99%的分类准确度,与其它算法相比,提升了9.2%和1.9%。最后,加入了Friedman检验,从统计的角度对所有的分类算法进行了评估。4)提出了一种利用空间金字塔深度网络提取多尺度深度特征进行集成医学图像自动分类算法,以解决医学图像数据集中图像的分辨率不尽相同以及避免对其进行直接缩放或裁剪到固定的分辨率之做法所导致的图像信息丢失问题,从而保证分类的准确度。该算法能够把不同分辨率图像作为输入,并把训练好的空间金字塔网络作为编码网络,对提取到的图像特征图进行金字塔池化操作,经过金字塔池化操作之后能够得到多尺度的深度特征。利用随机森林算法对提取得到的多尺度深度特征进行集成,投票得到最后的分类结果。算法在数据集Blood Cell(BS)和chest-xray-pneumonia(CXP)上能分别得到了91.51%和92.5%的准确度。与其它算法相比,提高了1.99%和4.0%。