论文部分内容阅读
癌症已成为世界上最常见和最危险的疾病之一,每年的全球发病率和死亡率正在逐渐增长。癌症的早期诊断是有效预防和治疗的关键因素。目前,癌症检测的黄金标准仍是组织切片的病理检查,这在一定程度上为临床治疗提供了重要依据。随着计算机辅助诊断技术的飞速发展,研究者提出了基于组织病理学切片的计算机自动分析技术,用于综合研究和分析显微细胞图像。由于显微图像面临着颜色不均匀、光照不一致和细胞粘连严重等问题,准确分割细胞核仍然面临挑战。基于深度学习的显微细胞图像分类能够自动从原始图像中学习和挖掘复杂的判别信息,避免了人工阅片和细胞核分割引起的误差影响,在特征分析领域里具有不错的性能优势。但深度学习通常需要大量的带标签样本才足以训练一个较可靠的深度模型。为了解决细胞显微图像样本量少的问题,迁移学习被应用于图像分类,以避免模型过拟合。然而对于小样本集来说,迁移学习将产生高维度的高阶特征向量,且高阶特征中可能包含冗余和不相关特征,使得全连接层被过度训练,严重削弱模型的泛化能力。
针对上述问题,论文基于老鼠肠道模型显微图像提出了基于混合深度模型和自适应特征学习的显微图像分类算法以及基于深度迁移网络和旋转子空间集成学习的显微图像分类算法,用于解决小样本的高维高阶特征所带来的过拟合问题,提高模型的泛化能力。论文工作的研究内容为:
①针对小样本的高维高阶特征易导致模型泛化性能不高的问题,论文提出了基于混合深度模型和自适应特征学习的显微图像分类算法。首先,利用ImageNet数据集预训练深度残差网络,将底层卷积层和池化层的结构和参数冻结迁移到目标数据集。根据老鼠肠道显微图像的特点,在预训练模型的基础上搭建新的顶层结构并进行微调,以提取图像的深层次高阶特征。然后,基于堆叠式稀疏自编码器对高阶特征进行稀疏降维,并提取每个隐藏层的稀疏编码特征。根据自适应权重匹配的方法,对每层编码特征分配最佳的权值,以实现特征之间的优势互补。最后对加权特征进行级联融合以及使用支持向量机对融合特征分类。
②针对高阶特征维数远大于样本个数的问题,论文提出了基于深度迁移网络和旋转子空间集成学习的显微图像分类算法。首先,利用迁移学习模型提取原始显微细胞图像的高阶特征。然后利用旋转样本子空间抽样法来增加高阶特征训练集之间的多样性,以及使用基于流形学习的子空间映射法对高阶特征进行非线性降维。最后利用集成模型对最终的降维特征进行分类。
论文主要解决了基于深度迁移模型的小样本高维高阶特征所带来的过拟合问题,增强了分类模型的识别能力。论文提出的方法为早期癌症诊断提供了重要工具,尤其是从病理正常的细胞图像中探测到细胞结构的细微变化,提高了显微图像的分类性能。
针对上述问题,论文基于老鼠肠道模型显微图像提出了基于混合深度模型和自适应特征学习的显微图像分类算法以及基于深度迁移网络和旋转子空间集成学习的显微图像分类算法,用于解决小样本的高维高阶特征所带来的过拟合问题,提高模型的泛化能力。论文工作的研究内容为:
①针对小样本的高维高阶特征易导致模型泛化性能不高的问题,论文提出了基于混合深度模型和自适应特征学习的显微图像分类算法。首先,利用ImageNet数据集预训练深度残差网络,将底层卷积层和池化层的结构和参数冻结迁移到目标数据集。根据老鼠肠道显微图像的特点,在预训练模型的基础上搭建新的顶层结构并进行微调,以提取图像的深层次高阶特征。然后,基于堆叠式稀疏自编码器对高阶特征进行稀疏降维,并提取每个隐藏层的稀疏编码特征。根据自适应权重匹配的方法,对每层编码特征分配最佳的权值,以实现特征之间的优势互补。最后对加权特征进行级联融合以及使用支持向量机对融合特征分类。
②针对高阶特征维数远大于样本个数的问题,论文提出了基于深度迁移网络和旋转子空间集成学习的显微图像分类算法。首先,利用迁移学习模型提取原始显微细胞图像的高阶特征。然后利用旋转样本子空间抽样法来增加高阶特征训练集之间的多样性,以及使用基于流形学习的子空间映射法对高阶特征进行非线性降维。最后利用集成模型对最终的降维特征进行分类。
论文主要解决了基于深度迁移模型的小样本高维高阶特征所带来的过拟合问题,增强了分类模型的识别能力。论文提出的方法为早期癌症诊断提供了重要工具,尤其是从病理正常的细胞图像中探测到细胞结构的细微变化,提高了显微图像的分类性能。