论文部分内容阅读
零样本学习是目前迁移学习领域的研究热点之一,与传统的图像分类问题不同,零样本学习旨在识别从未见过的数据类别,即在测试阶段所分类和识别的样本未参与分类器模型的训练。在求解零样本学习问题过程中,为实现从可见类别到不可见类别的知识迁移,分类模型需要通过视觉属性等辅助知识构建从底层特征到类别标签的映射。属性是指可以通过人工标注并且能在图像中观察到的特性,是图像内容的高层描述,能够同时被机器和人理解。大量的研究显示了属性学习在目标识别、图像描述以及零样本学习等方面的作用。零样本学习的过程可以看做是图像与视觉属性之间的映射。为了便于研究,多数零样本学习不直接使用图片,而是利用既有的特征提取模型来提取图像的特征。提取出的特征称为特征空间,而用人工标定的属性被称为属性空间。零样本学习的过程又可以看做是特征空间与属性空间之间的映射。零样本学习有效的方法是将特征空间和属性空间的数据映射至一个嵌入空间,再利用KNN等分类算法对嵌入空间的数据进行处理。目前,为完成特征空间和属性空间到嵌入空间映射,应用最多的是基于神经网络的研究方法。而多数基于神经网络的方法都是浅层全连接,这使得网络映射很难有较高的准确率。为了解决这个问题,本文提出了一种基于残差结构的新型生成对抗网络。新的神经网络结构Res-Gan,是一种基于残差结构的生成对抗网络。在神经网络训练过程中,网络前层的梯度容易受后层的影响,在训练过程中梯度逐渐减小,很容易出现梯度消失的问题。因此我们在神经网络中引入残差结构,使神经网络的深度增加的同时避免梯度消失。我们提出将残差结构思想引入到零样本学习的模型中,残差结构使得网络的深度大大增加,从而使得网络的性能进一步增强。另外,我们提出具有残差结构的生成对抗网络。我们将残差结构融入到GAN模型的生成网络和判别网络中,构成Res-Gan,使得网络性能达到最佳。如果网络使用单一激活函数,将使得网络的非线性映射能力或运算速度降低,为进一步改善所提出Res-Gan网络的性能,我们比较了几种激活函数的特点,在网络中设计了多种激活函数。此外,我们对属性进行了加权,不再将所有的属性同等对待。而是使得重要的属性得到增强,次要的属性得到抑制从而提升学习的效果。