论文部分内容阅读
图表示学习是机器学习领域的一项重要研究任务,并被广泛应用于计算机视觉的各种应用问题中。通过图表示学习可以深入地了解结构化数据信息。传统的机器学习方法通常使用度统计或者核函数的启发式方法来提取图的结构信息。随着深度学习和非线性降维技术的发展,通过自学习将图结构编码为低维嵌入的方法越来越多。这些方法地提出可以更好地利用图结构,更深入地挖掘数据信息。在很多实际的问题中,由于手动标记数据的成本高昂,标记数据的数量远小于未标记数据的数量。在这些学习任务中,传统的监督学习可能因为样本缺少而导致学习不足。同时,标记样本和未标记样本均是从总体中通过独立同分布采样得到的,因此未标记样本所包含的数据信息对训练过程也是有用的。为了解决这个问题提出了半监督学习,它利用未标记的数据来提高监督学习的性能。特别是,基于图的半监督学习算法已被广泛应用,例如手写数字分类,医学图像分割,词义消歧,图像检索等。通过与其它半监督学习方法比较发现,基于图的半监督学习方法可以更好地利用数据分布揭示未标记数据的信息。近年来,图卷积神经网络已被广泛研究用于图结构化数据表示和学习。本文提出了图扩散-嵌入网络(Graph diffusion-embedding networks GDENs),这是一种用于图结构化数据表示和学习的模型。基于图特征扩散的启发,GDENs通过采用扩散嵌入模型,将特征扩散和图节点(低维)嵌入同时集成到一个网络中。GDENs主要具有两个优点。首先,可以通过简单的闭合解来获得GDENs中扩散嵌入操作的平衡表示,从而保证了GDENs的紧凑性和计算效率。其次,提出的GDENs可以进行一定地拓展以处理具有多图结构的数据。在几个基准数据集上进行的各种半监督学习任务的实验表明,提出的GDENs模型明显优于传统的图卷积网络。本文还将所提出的半监督学习模型应用于视觉目标跟踪任务,同时考虑到目标跟踪中消除背景信息影响的难点,提出了对目标表示和跟踪采用分块加权的方法。首先,将目标边界框划分为多个不重叠的图像块,然后通过有效的图节点排序模型为每个图像块分配权重,权重大的图像块更有可能属于目标对象,权重小的图像块更有可能属于背景信息。最后,将得到的加权图像块描述子结合到结构化SVM的跟踪框架中实现目标跟踪。本文针对权重计算的排序模型提出了三种方法:1)首先,采用弹性流形排序模型进行图像块权重计算,挖掘图像块的一元特征和结构关系,从而比通常只挖掘图像块结构关系的现有模型更具区分性。然后,通过学习自适应图,以更好地捕获图像块之间的内在关系,从而有助于获得更鲁棒的图像块表示。2)在上一个方法的基础上,将自适应图学习与图像块权重的计算融合在一起,在这个过程中它们可以相互促进,因此可以提升各自的性能,以得到更鲁棒的加权图像块表示。3)针对视觉跟踪问题中的加权图像块表示,提出了一种统一时序相关和空间图优化排序模型。所提出的模型同时挖掘数据的一元特征,结构关系和时序相关性,因此与通常仅挖掘图像块的结构关系的现有模型相比,其性能更鲁棒,更具判别力。在几个标准数据集上进行的目标跟踪实验表明了上述跟踪算法的鲁棒性和有效性。