论文部分内容阅读
零样本图像分类通过语义知识建立了已知类别到未知类别的纽带,从而能够识别训练阶段未见过的类别,目前已成为计算机视觉领域的研究热点之一。建立的纽带包括语义属性和语义词向量,语义属性是对图像的语义描述,语义词向量是类别标签对应的文本特征。现有的零样本图像分类算法研究了属性学习和从视觉到语义的映射函数学习。但是,现有的方法忽略了相似度计算的度量方法和语义知识的构建,本文针对其不足进行了改进,主要工作包括:(1)针对不同属性对分类决策具有相同权重的问题,提出熵值法属性权重学习的零样本图像分类算法。该方法利用全连接层构建视觉和语义的联合嵌入模型,然后引入熵值法学习属性的权重,进而得到属性加权的距离函数,并用于最近邻搜索。实验结果表明改进的方法提高了模型的准确率,同时证明了选择不同的嵌入空间也会影响识别精度。(2)针对单一辅助知识描述目标的局限性,提出了自适应加权融合特征的零样本图像分类算法。该方法利用神经网络融合文本特征和语义属性,再引入粒子群优化算法确定特征融合的权重,能够加强语义信息的丰富性,从而将加权融合的特征用于零样本图像分类。实验结果表明改进的方法提高了分类模型的识别精度和鲁棒性,同时增强了语义知识的健壮性。(3)针对相似度计算中固定度量函数的缺陷,提出了度量学习改进的语义自编码分类算法。该方法使用语义自编码构建视觉和语义的联合嵌入模型,再通过对原始数据的学习获得可调节参数的度量函数,然后采用得到的度量函数计算特征间的相似度。实验结果表明度量学习改善了特征的分布,使类内的特征分布更加的紧凑,从而降低了分类模型的错误率。针对度量方法和语义知识的不足,本文基于熵值法、粒子群优化算法和度量学习提出了改进的算法,这些方法提高了模型的准确率和鲁棒性,增强了语义信息的丰富性。