论文部分内容阅读
度量学习作为计算机视觉领域重要的基础技术,在包括图像检索和分类、人脸识别、行人重识别等方向研究中均发挥了重要作用。度量学习的目的是学习一个能够准确反映样本间关系的度量函数。深度度量学习方法依靠深度神经网络的拟合能力,将网络模型作为度量函数,提取更具语义信息的特征。对抗学习作为生成对抗网络衍生出的学习策略,为许多研究提供了新的思路,并取得了良好的效果。
本文针对样本高阶特征间相似度的保持、不同难度样本的判定在对抗学习中发挥的作用、采样方法和判别器结构对对抗学习的影响等问题,对深度度量学习方法进行研究。本文将神经网络作为度量函数和生成器,并结合对抗学习的思想,提出基于朴素相似度判别器(Na?ve Similarity Discriminator,NSD)的对抗度量学习方法,提升了模型在图像检索和聚类任务的表现。本文的创新工作和主要内容如下:
①本文利用了深度神经网络优秀的学习能力,设计了无激活函数的特殊网络模型作为判别器,将生成器所提取的不同难度的样本特征对作为输入,判断其属于同类别的概率,并与对应的相似度标签组合为二分类交叉熵损失函数,优化模型中对应的模块。本文将该判别器模型称为朴素相似度判别器。
②本文设计了对抗采样方法,利用数据集中不同特性的数据训练不同的模块。本文构造了预训练、生成器训练和判别器训练三个阶段。首先用训练难度低的样本让判别模型学习较为理想的数据分布,再用训练难度高的样本使判别模型产生大量损失,对生成器模型进行修正。
③本文构造了离线简单样本挖掘方法,为训练判别器构造更大规模的简单样本集合,并在距离矩阵上构建全局最小生成树,在避免利用冗余样本的前提下,尽可能地利用了训练集信息。
④本文在3个度量学习领域最常用的数据集CUB-200-2011、Cars196和SOP上进行实验,通过与经典方法和效果最好的先进方法进行比较,对模型在图像检索和聚类问题上的表现进行评估。从实验结果可以看出,本文提出的方法在各项评价指标上都取得了很好的效果。此外,本文针对不同的朴素相似度判别器模型进行了剥离实验,分析判别器模型结构对模型性能的影响。
本文针对样本高阶特征间相似度的保持、不同难度样本的判定在对抗学习中发挥的作用、采样方法和判别器结构对对抗学习的影响等问题,对深度度量学习方法进行研究。本文将神经网络作为度量函数和生成器,并结合对抗学习的思想,提出基于朴素相似度判别器(Na?ve Similarity Discriminator,NSD)的对抗度量学习方法,提升了模型在图像检索和聚类任务的表现。本文的创新工作和主要内容如下:
①本文利用了深度神经网络优秀的学习能力,设计了无激活函数的特殊网络模型作为判别器,将生成器所提取的不同难度的样本特征对作为输入,判断其属于同类别的概率,并与对应的相似度标签组合为二分类交叉熵损失函数,优化模型中对应的模块。本文将该判别器模型称为朴素相似度判别器。
②本文设计了对抗采样方法,利用数据集中不同特性的数据训练不同的模块。本文构造了预训练、生成器训练和判别器训练三个阶段。首先用训练难度低的样本让判别模型学习较为理想的数据分布,再用训练难度高的样本使判别模型产生大量损失,对生成器模型进行修正。
③本文构造了离线简单样本挖掘方法,为训练判别器构造更大规模的简单样本集合,并在距离矩阵上构建全局最小生成树,在避免利用冗余样本的前提下,尽可能地利用了训练集信息。
④本文在3个度量学习领域最常用的数据集CUB-200-2011、Cars196和SOP上进行实验,通过与经典方法和效果最好的先进方法进行比较,对模型在图像检索和聚类问题上的表现进行评估。从实验结果可以看出,本文提出的方法在各项评价指标上都取得了很好的效果。此外,本文针对不同的朴素相似度判别器模型进行了剥离实验,分析判别器模型结构对模型性能的影响。