论文部分内容阅读
近年来,计算机视觉技术的飞速发展推动了医学图像领域新技术的提升,本文利用计算机视觉技术解决皮肤镜下恶性黑色素瘤图像的分类问题。据数据表明,黑色素瘤肿瘤占皮肤病的5%,同时也是皮肤病中死亡率最高的一种,占皮肤病总死亡率的75%。如果能在早期诊断出黑色素瘤病变并通过治疗,5年内生存率高达97%。因此,早期皮肤镜黑色素瘤病变诊断的意义重大,有助于避免成千上万病人因延误而错失治疗良机。深度学习在计算机视觉有着出色表现,尤其在图像的分类和识别领域。但深度学习方法需要大量的训练数据,而医学图像领域病例数据往往有限,例如,皮肤癌的病例数据不多,同时存在数据不均衡问题,这大大增加了恶性黑色素瘤皮肤病图像检测与分类识别的难度。针对上述问题,本文以皮肤镜图像为研究对象,利用深度卷积神经网络(CNN),并通过数据增强和改进loss函数方法实现皮肤病图像的分类及识别,最后利用集成学习进一步提高卷积神经网络的泛化性,其主要研究内容分以下四部分:第一,首先根据皮肤镜下皮肤病图像的特征,利用深度卷积神经网络对良性皮肤病和恶性黑色素瘤进行分类与识别;第二,由于数据量较少,且存在数据不均衡问题,本文结合深度卷积神经网络,利用特殊的数据增强方式,改进损失函数——Focal loss等方法,进一步提高了深度卷积神经网络的分类精度,增强了最终训练模型的泛化性能。经实验结果对比,进行数据增强且经过改进的损失函数的神经网络分类效果明显优于普通的神经网络。第三,以此为基础,通过集成学习中的Boosting方法对多个神经网络训练结果进行集成,由对比实验可以看出结合集成学习的多神经网络模型的效果要明显优于单一神经网络的效果,网络泛化性得到进一步提高。第四,利用二次集成学习,将通过Boosting算法集成的深度卷积神经网络再与其他训练的神经网络模型进行类似bagging算法集成,实验结果表明效果更优于单一的Boosting算法集成神经网络,再次证明了集成学习可以很大程度提高深度神经网络的泛化性能,使最终得到的训练模型具有更好的效果。本文研究成果显著,准确率、AUC、AP、灵敏度、特异度等分类指标相比于2016年竞赛第一名成绩都有一定提高,最少可提高0.5个点,最多可提高6.6个点。