基于迁移学习的跨域图像分类方法研究

来源 :西安电子科技大学 | 被引量 : 2次 | 上传用户:new_fisher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像的数量急剧增多,图像分类变得越来越重要。传统的图像学习方法要求有大量的带标记的图像样本。但是为每个类别的图像都标注充足的样本需要大量的人工劳动和时间,尤其对于一些不常见的或者新出现的类别,甚至是不现实的。当带标记图像数量太少时,训练得到的分类器效果非常差。值得庆幸的是,现实中存在大量已经标注好的相关的图像数据集,即源域数据集。如何利用这些源域图像辅助仅有少量甚至没有标记样本的目标域图像分类是当今机器学习和计算机视觉领域的研究热点,也是本文的研究重点。源域和目标域的分布差距比较大,如何克服它们的分布差异也是本文研究的重点。本文提出一系列方法来解决利用大量带标记的源域图像来辅助目标域图像的分类问题,即跨域图像分类问题。首先,假设目标域没有或者仅有少量带标记的RGB图像,但是源域有大量带标记的相关的RGB图像。在这种情况下,利用源域RGB图像辅助目标域RGB图像的分类问题。其次,假设目标域仅有少量带标记的RGB-D图像,但是源域有大量带标记的相关的RGB图像。在这种情况下,利用源域RGB图像辅助目标域RGB-D图像的分类问题。再次,鉴于深度图像的优点,利用带标记的RGB-D图像作为源域,辅助目标域RGB图像的分类问题。最后,当源域和目标域类别没有交集时,借助源域和目标域共享的属性和源域的知识对目标域RGB图像进行分类。研究基于迁移学习的跨域图像分类是为了将源域的知识更好地迁移到目标域,提高目标域图像的分类正确率。具体来说,本文的贡献和创新之处包括以下五个方面:1.给定包蕴大量带标记图像的源域数据集和图像都不带标记的目标域数据集。提出一种基于子空间和稀疏编码的跨域图像表示方法,把源域和目标域数据映射到一个共同的子空间,然后学习稀疏编码和共享的字典。有些源域样本即使映射到共同的子空间后,仍然和目标域分布差异很大,所以利用L2,1范数约束源域映射矩阵,根据与目标域的关系重新给源域样本赋权重。该方法的优点是学到的稀疏编码对域差异和源域不相关样本不敏感。本文利用基于交替迭代更新的方法优化映射矩阵、稀疏编码和两域共享的字典。实验结果表明,本章方法学到的跨域图像表示有助于目标域图像分类的任务,并且明显优于其他方法。2.图像数据有非线性和高维的特点,源域有大量带标记的图像数据,目标域仅有少量带标记的图像数据。针对这种情形,提出一种基于核稀疏编码的监督迁移学习图像表示方法,把源域和目标域图像映射到核空间学习稀疏编码和字典。该方法在学习字典和稀疏编码的过程中,同时考虑源域和目标域的分布差异,数据的流形结构,源域和目标域同类样本的相关性,从而使学得的稀疏编码更加有判别性并且对域差异不敏感。实验结果表明该算法学到的稀疏编码能够提高目标域图像的分类性能。3.针对RGB-D图像标记样本少的问题,提出一种利用大量相关的RGB图像来辅助RGB-D图像分类的方法,利用源域RGB图像,目标域RGB图像以及目标域组合的RGB图像和深度图像学习耦合分类器。该方法利用目标域深度图像和RGB图像之间的关系,使两个目标域分类器的预测结果一致,学得更加准确的目标域分类器;并且利用源域RGB图像和目标域RGB图像的关系,联合约束两域的分类器,达到同时去除不相关特征的目的。实验结果表明该算法能够充分地利用大量相关的带标记RGB图像提高仅有少量标记样本的RGB-D图像的分类效果。4.深度图像的优势是比RGB图像对光照变化,背景变化,色彩和亮度变化更加鲁棒。但是,当任务是对少量带标记的RGB图像进行分类,如何利用这些带标记的RGB-D图像是一个重要的问题。针对这个问题,提出一种从RGB-D图像到RGB图像的域自适应方法。该方法利用低秩约束最大化源域RGB图像和深度图像的相关性,通过最小化源域和目标域的最大均值差异来缩小源域和目标域的分布差异。该方法的优点是能够把最大化源域RGB图像和深度图像的相关性以及最小化源域和目标域的差异性加入源域和目标域的分类器模型中,然后在一个统一的框架中学习分类器参数。实验结果表明该算法能够很好地利用相关的RGB-D图像尤其是其深度信息,来辅助少量带标记的RGB图像的分类。5.给定目标域没有训练样本,并且和源域样本类别空间不一致,即零样本图像分类问题。大部分零样本分类方法关注如何把图像映射到语义空间。然而已知类和未知类图像域差异很大,直接把利用源域图像和语义表示求出的映射函数用于目标域会产生误差。针对此问题,提出一种基于知识迁移和保存数据性质的零样本学习方法,首先求出源域类别的语义表示和目标域类别的语义表示之间的关系,然后利用求得的关系把源域的分类器迁移到目标域。为了克服域差异问题,该方法在预测目标域样本的类别时,不仅利用从源域迁移的分类器,还考虑目标域数据自身的性质。实验结果表明,该方法学到的目标域分类器更加准确,取得了更高的目标域图像分类正确率。
其他文献
青藏高原蕨麻抗氧化作用的研究采用Na2 S2 O3 I2 碘量法及DDPH·法测定干鲜蕨麻提取物的抗氧化作用 ,结果表明 :不同溶剂蕨麻提取物对高原菜籽油的抗氧化作用依次是PBS >冰
目前,2024铝合金冷轧板在航空航天领域应用广泛。2024铝合金属于Al-Cu-Mg系高强变形铝合金,具有强度高、密度低、耐热性能和成形性能优良等优点。2024铝合金冷轧板的主要生产工艺流程为:熔铸→均匀化退火→热轧→冷轧→固溶处理→时效。2024铝合金属于可热处理强化型铝合金,固溶处理和时效是2024铝合金冷轧板主要的热处理强化工艺,合理的热处理工艺参数对合金起强化作用,并可以获得良好的综合性能
魏禧,清初古文三大家之一,一生好《左传》,《左传》的“三不朽”思想,尤其是立言不朽,成为其散文创作的动机之一。国变之后,深熟于《左传》的魏禧,又从中找到思想上与心灵上
摘要$$山西省大同市的水泥生产资源优厚,产量巨大。散装水泥和预拌混凝土经十几年的大力发展,已极具规模,但预拌砂浆发展较为滞后。大同市是我国的老能源基地,正在大力推进城
报纸
本文以编辑《费孝通社会学初探》讲义为例,简要介绍了费孝通先生对中国社会学学科体系发展做出的巨大贡献。文章认为,费孝通社会学是中国社会学和社会学中国学派的开创,是中国社
以邻溴苯胺为原料,经过酰化、烯丙基化,最后在Pd配体催化下经Heck反应得到目标产物N-苯甲酰基-3-甲基吲哚,最后采用IR,1 H NMR和13 C NMR等手段对目标产物的结构进行确认。
<正>聚焦写作教学的实质是为学生完成写作任务提供各种需要的支持。这些支持主要来自教师、教学材料和学习伙伴三个方面。相对而言,在教学实践中,我们更关注教师和教学材料作
为了防止国外商业化生产的转基因番木瓜流入国内市场,建立转基因番木瓜55-1转化事件定性PCR检测方法,对于保护国内消费者知情权意义重大。本研究以转基因抗环斑病毒番木瓜55-
目的:观察髋/膝关节置换术对老年患者体内凝血酶生成(thrombin generation,TG)、凝血酶原片段1+2(prothrombin fragment 1+2,F 1+2)、凝血酶-抗凝血酶复合物(thrombin-antithrombi
主要运用偏泛函微分方程理论,算子半群理论和无穷维动力系统理论,研究了几类偏泛函微分方程解的动力学行为,包括拉回吸引子的存在性、维数及其上半连续性,平衡解的多项式稳定