论文部分内容阅读
图像分类是计算机视觉领域中的一个重要组成部分,通过计算机分类图像中目标所属不同类别,达到自动处理和分类图像的目的。在不同的图像分类任务中,人脸表情分类(Facial Expression Recognition,FER)与合成孔径雷达(Synthetic Aperture Radar,SAR)目标分类因其分别在人机交互、医疗、心里咨询以及军事、测绘、资源勘探等领域有着重要的应用价值,越来越多的学者和科研机构将研究重心都放在人脸表情分类和合成孔径雷达目标分类上。图像分类流程一般分包括:图像预处理、图像目标特征提取以及图像目标分类。对于人脸表情分类任务,本文主要研究了利用迁移学习进行人脸表情识别任务研究,以及在该任务中训练数据不足的问题,并研究如何有效利用网络人脸表情数据;针对SAR图像目标分类任务,本文主要对不同卷积神经网络(Convolutional Neural Network,CNN)结构对SAR图像目标分类性能的影响进行了研究,研究了基于Inception结构的SAR图像目标分类。针对以上问题,本文主要做了以下几个工作:(1)针对人脸表情任务中训练数据量不足的问题,本文利用迁移学习方法将在人脸分类任务上训练后的深度卷积神经网络迁移到人脸表情分类任务中,为了增强网络的分类能力,提出双激活层网络结构和Softmax-MSE损失函数,并将其应用到卷积神经网络结构中。实验表明,本文所提方法能够较大地提升模型分类能力,在FER 2013数据库和SFEW 2.0数据库上分别获得了61.59%和47.23%的主流分类效果。(2)在互联网以及各类社交软件中包含大量人脸表情图像数据,能够利用好这些数据对于提升人脸表情分类任务的性能具有重要的意义。然而,网络人脸表情数据普遍存在标签错乱的问题,给基于网络人脸表情分类带来了极大的挑战。为了更好地解决网络人脸表情数据普遍存在的标签错误和无标签问题,本文采用了一种基于主动学习和迁移学习的海量网络人脸表情数据的表情分类模型训练方法。同时,本文也探究了二阶段迁移学习过程。本文在FER2013数据库和SFEW2.0数据库和网络表情数据集Web EXP数据集上进行实验,验证了本文方法的有效性。(3)为了研究不同卷积神经网络结构对于SAR图像目标分类性能的影响,本文首先对MSTAR数据库进行数据库增强处理,通过对数据库中图像按顺时针一度一度地旋转,将原数据库扩展360倍。然后,本文分别从不同卷积核尺寸大小、不同卷积层数目、有无Re LU激活函数等因素研究卷积神经网络对SAR图像目标分类的影响。在此基础上,本文构建了一个两层卷积神经网络模型,以Softmax分类器进行分类。此外,本文还研究了一种基于Inception结构的SAR图像目标分类方法,提出了Inception-SAR网络结构模型。实验结果表明,在进行数据增强处理之后的MSTAR数据库上训练两层卷积神经网络,本文所提两种卷积神经网络模型在3类SAR目标分类实验中取得了较好的实验结果。