论文部分内容阅读
图像作为信息和数据的重要载体,已广泛渗透于现代生产生活的每个环节。利用机器学习方法对海量图像进行分类等加工处理已成为当今各行业领域生产力提升的迫切需求。零样本图像分类是指在训练集有标签样本类别无法涵盖测试集所有类别的情况下,利用属性等辅助信息实现对测试样本的正确分类。零样本图像分类在当前图像涉及类别及场景极速增长、新类别层出不穷和分类精细度不断提升等背景下,具有广泛应用前景。本文针对当前零样本图像分类研究中特征-属性关系构建不全面、属性描述不充分等问题,利用弹性网约束、宽度学习和属性关系有向图等方法充分挖掘属性-特征关系、属性-属性关系、属性空间结构和属性-类别关系,提出了四种基于属性挖掘的零样本图像分类方法,主要工作如下:1.针对零样本图像分类中属性和特征表达能力不足的问题,提出基于增强属性-特征的宽度属性预测模型。首先,利用弹性网约束学习二值化的稀疏增强属性,并与手动标定的语义属性共同构成混合属性;其次,通过宽度学习的增强节点获得增强特征,对已有图像特征进行扩展;同时,采用宽度学习中岭回归的伪逆矩阵投影同步得到所有属性的预测结果;最后,通过曼哈顿距离计算预测属性与各测试类属性的相似性,实现零样本图像分类。2.针对属性描述不充分和属性与特征之间映射不全面的问题,提出基于加权重构混合属性组的零样本图像分类模型。首先,利用层次聚类对语义属性进行自动分组,然后通过宽度结构对属性分别按组进行增强,共同构成混合属性;其次,考虑属性组之间的权重关系,通过加权自动编码器实现属性空间和特征空间之间的映射;同时,在目标函数中引入结构化稀疏L21范数,去除属性冗余;最后,在特征空间计算测试样本特征和各预测类别特征的相似性,实现零样本图像分类。3.针对属性和特征之间映射不全面的问题,同时考虑合理挖掘属性空间结构,提出基于关系有向图正则化的属性三因子分解模型。首先,利用属性的矩阵三因子分解实现属性空间和特征空间的映射,将投影矩阵作为训练和测试阶段的共享因子;其次,通过加权属性之间的相似性定义权值矩阵,构建属性关系有向图;最后,在属性空间或特征空间计算测试样本和各测试类别的相似性,实现图像分类。针对投影领域偏移问题,通过同时考虑测试类别关系和测试样本分布进一步提出直推式模型。4.针对属性与特征关系缺乏考虑样本特征分布的问题,同时考虑现有生成模型中类别属性表示过于相似、测试集中生成样本和真实样本分布不一致的缺点,提出基于属性核矩阵的生成特征领域自适应模型。首先,利用核方法在语义空间计算核函数,进而构造属性核矩阵;其次,将语义属性-类别关系矩阵与属性核矩阵合并作为条件,通过条件Wasserstein生成对抗网络得到伪样本特征;然后,采用联合分布自适应方法缩小测试集有标签生成样本与无标签真实样本的边缘分布和条件分布差异;最后,利用测试集生成样本,通过有监督学习实现零样本图像分类。在公共属性数据集上的对比实验结果表明,所提算法均有效提高了不同设置情形下的零样本图像分类精度。本文研究成果不仅可以丰富现有的机器学习理论和方法,而且能够广泛推广应用到诸多相关领域,具有重要理论意义和实用价值。论文共包含图58幅,表12个,参考文献216篇。