论文部分内容阅读
随着机器学习领域的不断发展,深度学习方法作为机器学习领域的重要分支在很多领域取得了令人印象深刻的成果,比如自动驾驶(Automatic Drive)、语音识别(Speech Recognition)、图像检测(Image Detection and Recognition)和风格迁移(Image Style Transfer)等。在这些领域里训练高性能的复杂深度神经网络通常需要大量带标注的可训练数据才能达到理想效果,但是对于一些新兴领域和任务收集并标注大量可用训练数据通常很昂贵且非常耗时,而且对于一些与时序关联的领域和任务收集标注的数据很容易就过时了。对于这些任务使用深度学习方法通常由于数据量的缺乏很难学习到一个理想的神经网络模型。因此,迁移学习作为一种解决这类问题的有效手段开始受到研究者们的关注和发展,迁移学习是运用已有的知识对不同但相关领域问题进行求解的一种新的机器学习方法。本文旨在研究基于深度卷积神经网络的迁移学习算法,分别针对小数据集下的迁移学习任务和无监督的领域自适应任务提出了新的鲁棒性识别方法。本文的主要工作包括:(1)在小数据集迁移学习任务上,针对已有的卷积特征迁移方法在对目标网络模型的构建过程中缺乏灵活性的问题,本文基于目前性能优越的深度卷积神经网络模型提出了一种新的卷积特征迁移架构,并且选择了三种常用的卷积网络模型作为实例给出了具体的迁移方法;在上述的方法基础上本文提出了一种自适应的特征输入方法,使得目标网络卷积层可以只关注为当前层特征转换带来助益的特征;此外作为上述方法的特例,针对目标卷积网络模型和源特征生成器模型具有相同的结构的情况,提出了一种同时进行特征迁移和微调(finetuning)的方法。(2)在无监督的领域自适应任务上,本文在最大分类差异方法(MCD)的基础上创新性地引入了最大均值差异惩罚项(MMD),这样可以同时匹配域间分类边界和域间特征分布,从而可以提升无监督领域自适应的效果;由于本文使用的卷积神经网络是rectifier卷积神经网络而且rectifier卷积神经网络是目前最常用的卷积神经网络,为此本文根据rectifier卷积神经网络的特性提出了一种新的正则化方法,实验结果表明在迁移任务上使用这种正则化方法比传统正则化方法效果更好,可以进一步增强目标卷积神经网络的鲁棒性。