论文部分内容阅读
图像分类是计算机视觉研究领域的研究重点及热点,深度学习的发展使图像分类技术的研究取得突破性的进展。基于深度卷积神经网络的图像分类网络结构的探索已经相对成熟,如何提升深度卷积神经网络的特征表达能力,是进一步提高网络的图像分类性能重要研究内容。本文通过研究密集连接卷积神经网络(DenseNet),结合软注意力机制方法,对通道特征、层间特征及特征点进行探索,提升DenseNet的特征提取能力并实现更精准的图像分类。
首先,针对DenseNet中,每个卷积层的输入只是前部输出特征图简单合并的缺点,在DenseNet中融入计算通道特征相关性的通道特征注意力,提出通道特征重标定DenseNet(Channel Feature Reweight DenseNet,CFR-DenseNet);针对卷积操作的局部性,在通道特征重标定DenseNet中引入建模特征点相关性的特征点注意力,提出特征通道及特征点重标定DenseNet(Channel-wise and Feature-points Reweights DenseNet,CAPR-DenseNet),该网络自适应地校准通道特征响应,并显式地建模特征点之间的相互依赖性,通过在CIFAR数据集上图像分类实验,证明了CAPR-DenseNet的有效性。
其次,针对DenseNet没有充分考虑层间特征相关性的缺点,在网络中融入层间特征注意力,构建了层间特征重标定DenseNet(Inter-Layer Feature Reweight DenseNet,ILFR-DenseNet);并采用模型集成的方法将层间特征重标定DenseNet与通道特征重标定DenseNet相结合,提出多级特征重标定DenseNet(Multiple Feature Reweight DenseNet,MFR-DenseNet),充分发挥层间特征重标定与通道特征重标定的优势,进一步提高了DenseNet的特征表达能力。为了验证方法的有效性,在CIFAR数据集上进行图像分类实验,实验发现,100层MFR-DenseNet参数量仅为14.2M的情况下,在CIFAR-10上测试错误率达到3.57%,在CIFAR-100上测试错误率达到18.27%,MFR-DenseNet在CIFAR-10和CIFAR-100数据集上的图像分类性能优于大多数先前深度学习图像分类方法的性能。
最后,针对多级特征重标定DenseNet无法端到端训练,过程繁琐,参数量及计算量大,训练及测试耗时长的缺点,提出一种可端到端训练的双通道特征重标定DenseNet(Dual Feature Reweight DenseNet ,DFR-DenseNet)。通过在CIFAR-10/100和高分辨率人脸年龄数据集MORPH、Adience上进行实验,发现与MFR-DenseNet相比网络参数量减少了一半,测试耗时约缩短为MFR-DenseNet测试耗时的61%,且DFR-DenseNet提高了图像分类的准确率,并对不同图像分类数据集有一定的适应性、实用性。
本文创新性地提出密集连接卷积神经网络的优化网络,通过在CIFAR及大分辨率人脸年龄数据集MORPH、Adience上的实验发现,本文所提方法能够增强网络的特征提取能力,并有效地提高图像分类的准确度。
首先,针对DenseNet中,每个卷积层的输入只是前部输出特征图简单合并的缺点,在DenseNet中融入计算通道特征相关性的通道特征注意力,提出通道特征重标定DenseNet(Channel Feature Reweight DenseNet,CFR-DenseNet);针对卷积操作的局部性,在通道特征重标定DenseNet中引入建模特征点相关性的特征点注意力,提出特征通道及特征点重标定DenseNet(Channel-wise and Feature-points Reweights DenseNet,CAPR-DenseNet),该网络自适应地校准通道特征响应,并显式地建模特征点之间的相互依赖性,通过在CIFAR数据集上图像分类实验,证明了CAPR-DenseNet的有效性。
其次,针对DenseNet没有充分考虑层间特征相关性的缺点,在网络中融入层间特征注意力,构建了层间特征重标定DenseNet(Inter-Layer Feature Reweight DenseNet,ILFR-DenseNet);并采用模型集成的方法将层间特征重标定DenseNet与通道特征重标定DenseNet相结合,提出多级特征重标定DenseNet(Multiple Feature Reweight DenseNet,MFR-DenseNet),充分发挥层间特征重标定与通道特征重标定的优势,进一步提高了DenseNet的特征表达能力。为了验证方法的有效性,在CIFAR数据集上进行图像分类实验,实验发现,100层MFR-DenseNet参数量仅为14.2M的情况下,在CIFAR-10上测试错误率达到3.57%,在CIFAR-100上测试错误率达到18.27%,MFR-DenseNet在CIFAR-10和CIFAR-100数据集上的图像分类性能优于大多数先前深度学习图像分类方法的性能。
最后,针对多级特征重标定DenseNet无法端到端训练,过程繁琐,参数量及计算量大,训练及测试耗时长的缺点,提出一种可端到端训练的双通道特征重标定DenseNet(Dual Feature Reweight DenseNet ,DFR-DenseNet)。通过在CIFAR-10/100和高分辨率人脸年龄数据集MORPH、Adience上进行实验,发现与MFR-DenseNet相比网络参数量减少了一半,测试耗时约缩短为MFR-DenseNet测试耗时的61%,且DFR-DenseNet提高了图像分类的准确率,并对不同图像分类数据集有一定的适应性、实用性。
本文创新性地提出密集连接卷积神经网络的优化网络,通过在CIFAR及大分辨率人脸年龄数据集MORPH、Adience上的实验发现,本文所提方法能够增强网络的特征提取能力,并有效地提高图像分类的准确度。