论文部分内容阅读
随着图像的数量急剧增多,图像分类变得越来越重要。传统的图像学习方法要求有大量的带标记的图像样本。但是为每个类别的图像都标注充足的样本需要大量的人工劳动和时间,尤其对于一些不常见的或者新出现的类别,甚至是不现实的。当带标记图像数量太少时,训练得到的分类器效果非常差。值得庆幸的是,现实中存在大量已经标注好的相关的图像数据集,即源域数据集。如何利用这些源域图像辅助仅有少量甚至没有标记样本的目标域图像分类是当今机器学习和计算机视觉领域的研究热点,也是本文的研究重点。源域和目标域的分布差距比较大,如何克服它们的分布差异也是本文研究的重点。本文提出一系列方法来解决利用大量带标记的源域图像来辅助目标域图像的分类问题,即跨域图像分类问题。首先,假设目标域没有或者仅有少量带标记的RGB图像,但是源域有大量带标记的相关的RGB图像。在这种情况下,利用源域RGB图像辅助目标域RGB图像的分类问题。其次,假设目标域仅有少量带标记的RGB-D图像,但是源域有大量带标记的相关的RGB图像。在这种情况下,利用源域RGB图像辅助目标域RGB-D图像的分类问题。再次,鉴于深度图像的优点,利用带标记的RGB-D图像作为源域,辅助目标域RGB图像的分类问题。最后,当源域和目标域类别没有交集时,借助源域和目标域共享的属性和源域的知识对目标域RGB图像进行分类。研究基于迁移学习的跨域图像分类是为了将源域的知识更好地迁移到目标域,提高目标域图像的分类正确率。具体来说,本文的贡献和创新之处包括以下五个方面:1.给定包蕴大量带标记图像的源域数据集和图像都不带标记的目标域数据集。提出一种基于子空间和稀疏编码的跨域图像表示方法,把源域和目标域数据映射到一个共同的子空间,然后学习稀疏编码和共享的字典。有些源域样本即使映射到共同的子空间后,仍然和目标域分布差异很大,所以利用L2,1范数约束源域映射矩阵,根据与目标域的关系重新给源域样本赋权重。该方法的优点是学到的稀疏编码对域差异和源域不相关样本不敏感。本文利用基于交替迭代更新的方法优化映射矩阵、稀疏编码和两域共享的字典。实验结果表明,本章方法学到的跨域图像表示有助于目标域图像分类的任务,并且明显优于其他方法。2.图像数据有非线性和高维的特点,源域有大量带标记的图像数据,目标域仅有少量带标记的图像数据。针对这种情形,提出一种基于核稀疏编码的监督迁移学习图像表示方法,把源域和目标域图像映射到核空间学习稀疏编码和字典。该方法在学习字典和稀疏编码的过程中,同时考虑源域和目标域的分布差异,数据的流形结构,源域和目标域同类样本的相关性,从而使学得的稀疏编码更加有判别性并且对域差异不敏感。实验结果表明该算法学到的稀疏编码能够提高目标域图像的分类性能。3.针对RGB-D图像标记样本少的问题,提出一种利用大量相关的RGB图像来辅助RGB-D图像分类的方法,利用源域RGB图像,目标域RGB图像以及目标域组合的RGB图像和深度图像学习耦合分类器。该方法利用目标域深度图像和RGB图像之间的关系,使两个目标域分类器的预测结果一致,学得更加准确的目标域分类器;并且利用源域RGB图像和目标域RGB图像的关系,联合约束两域的分类器,达到同时去除不相关特征的目的。实验结果表明该算法能够充分地利用大量相关的带标记RGB图像提高仅有少量标记样本的RGB-D图像的分类效果。4.深度图像的优势是比RGB图像对光照变化,背景变化,色彩和亮度变化更加鲁棒。但是,当任务是对少量带标记的RGB图像进行分类,如何利用这些带标记的RGB-D图像是一个重要的问题。针对这个问题,提出一种从RGB-D图像到RGB图像的域自适应方法。该方法利用低秩约束最大化源域RGB图像和深度图像的相关性,通过最小化源域和目标域的最大均值差异来缩小源域和目标域的分布差异。该方法的优点是能够把最大化源域RGB图像和深度图像的相关性以及最小化源域和目标域的差异性加入源域和目标域的分类器模型中,然后在一个统一的框架中学习分类器参数。实验结果表明该算法能够很好地利用相关的RGB-D图像尤其是其深度信息,来辅助少量带标记的RGB图像的分类。5.给定目标域没有训练样本,并且和源域样本类别空间不一致,即零样本图像分类问题。大部分零样本分类方法关注如何把图像映射到语义空间。然而已知类和未知类图像域差异很大,直接把利用源域图像和语义表示求出的映射函数用于目标域会产生误差。针对此问题,提出一种基于知识迁移和保存数据性质的零样本学习方法,首先求出源域类别的语义表示和目标域类别的语义表示之间的关系,然后利用求得的关系把源域的分类器迁移到目标域。为了克服域差异问题,该方法在预测目标域样本的类别时,不仅利用从源域迁移的分类器,还考虑目标域数据自身的性质。实验结果表明,该方法学到的目标域分类器更加准确,取得了更高的目标域图像分类正确率。