论文部分内容阅读
神经网络是通过学习人脑构造和其运作流程来进行信息处理的系统,大都基于大量标记好的高质量样本进行训练。但是实际上,人脑更擅长于从少量的简单样本中去识别各种物体的不同之处。在很多真实情况下,往往会遇到难以积累到足量样本或数据取样困难的问题,这些问题限制了人工智能的发展。因此,如何使模型只通过小样本数据就能实现快速学习,成为目前十分重要的研究方向。噪声问题是小样本的关键问题。当数据量充足时,算法很容易就能区分关键信息和噪声,因此很容易在无用信息(同一类别的细节特征)和有效信息(不同类别的关键区分特征)之间进行区别。相反,由于小样本中的样本量过少,很难明确找到这样的信息。这时候,增加一些其他手段来加强类别的建模能力就显得至关重要了。此外,拍摄角度或实际情况的变化也会造成形象的差异,这可能会导致映射后同一类的数据点依旧十分分散,不能很好的聚集。本文的主要内容概述如下:第一,本文回顾了小样本学习的发展,介绍了几个经典的小样本方法。尽管这些方法都解决了小样本学习中的一些问题,并提出了新的研究思路,但尚未解决小样本噪声严重,提取特征不明显,对异常数据敏感等关键问题。第二,针对上述缺陷,本文提出了投影判别网络。在浅层神经网络中,加入新的嵌入模块,引入线性判别分析的思想,缓解了噪声问题,使不同类别特征更加明显,让同一类别的数据点能够尽可能聚拢,不同类别的数据点能够尽可能分散。第三,在探讨空间是否线性可分的问题后,本文又提出了投影核判别分析网络。通过把核函数引入到嵌入模块中,使嵌入后的结构变得更加灵活和多变。通过投影到更高纬的空间,使不同类别在更高维空间上尽量分散。第四,在基准数据集MiniImageNet和CUB上,验证了投影判别网络的性能,并与先进的模型进行综合比较。在不同粒度的实验中,投影判别网络取得了较好的效果。通过不同层面对比了两种嵌入的优劣。对映射后的数据点进行可视化展示和探索性分析,最终表明投影判别网络是合理且有效的。此外,在基准数据集MiniImageNet和CUB上,同时也验证了投影核判别网络的性能。实验表明投影核判别网络得到了更高的准确率,且更能适应不同类型的各种子任务。