论文部分内容阅读
计算机视觉中的学习方法十分依赖于数据的表示方式。在图像大数据的背景下,以更加直观、高效的表示方式表示图像模式是计算机视觉中一个重要的研究方向,视觉属性是其中具有极大潜力的研究方向之一。近年来,计算机视觉中的视觉属性在图像理解、图像分类和图像检索等领域的成功应用引起了研究者们的高度重视。虽然视觉属性在计算机视觉不同领域中表现出巨大的潜力,但是目前存在视觉属性标定较为困难,图像视觉属性数据不足等问题,成为限制视觉属性广泛应用的瓶颈之一。为了克服上述问题,在有限视觉属性标定的图像数据的情况下,有效的将视觉属性应用于其它图像数据域上,本文基于迁移学习中的域适应学习算法,对图像视觉属性的学习方法展开研究,加强视觉属性在跨域图像数据上的应用效果。本文的主要工作如下:首先,从视觉属性数据集、底层视觉特征、中层的视觉特征和视觉属性四个层面详细总结了视觉属性的学习基本框架过程。以层级抽象的角度,揭示了视觉属性是对图像信息的高度抽象这一特点。在此基础上,本文通过详细丰富的定性化和定量化实验,分析比较了视觉属性在跨域后与底层视觉特征的语义分辨能力和分类能力。实验表明,在语义分辨能力和分类能力上,低维度的视觉属性相比于高维度底层视觉特征具有较大的优势。其次,提出区分性子空间对齐的视觉属性学习算法。区分性子空间学习算法将源域标签信息融入子空间生成过程中,并基于源域信息生成目标域的伪标签,通过区分性子空间的对齐减少源域和目标域之间分布的差异,减少域漂移的影响。最后通过实验表明该算法能继续保持视觉属性在新的图像数据域的语义性,并能相比于未迁移之前能在一定在程度上提升视觉属性的语义分辨能力和分类能力。最后,受子空间对齐思想启发,提出潜在稀疏子空间域适应视觉属性学习算法。该算法将源域和目标域投影到潜在空间中,通过保持投影后数据的方差和最大化均值差异的约束,减少源域和目标域分布之间的差异,最终将结果反馈到学习得到的稀疏系数矩阵中。实验表明该算法能进一步提升视觉属性在跨域数据集上的语义分辨能力和分类能力,证明了该算法在视觉属性学习上的有效性。