论文部分内容阅读
聚类是计算机视觉和机器学习研究中的一项重要任务。它广泛用于各个领域中,如图像分割、图像分类、场景分析、运动建模以及医学图像分析等。在过去的几十年中,许多学者对聚类问题进行了深入的研究并提出了一系列优秀的算法。其中,以图论为理论基础的图聚类方法表现出卓越的性能。它首先依据相似性度量将样本之间的关系建模成加权无向图,然后通过图的划分实现对样本的聚类。虽然现有的图聚类技术研究已经取得了许多成果,但仍然存在一些亟待解决的问题。例如,传统的图聚类方法通常采用某个确定的函数来构造样本的相似度图,而该相似度图不包含任何潜在的聚类结构信息且在整个学习过程中是固定不变的。由于图聚类方法的性能严重依赖于图的质量,因此这种相似度图构建方式不可避免的会影响聚类的效果。此外,大多数图聚类方法都采用两步学习策略,即将样本相似度图的构建与样本的聚类分为两个独立的过程。这种策略使得图的生成与样本的聚类过程没有任何交互,难以获得最优的聚类结果。针对这些挑战,本文提出了基于相似度学习的图聚类方法,主要包括以下两个工作:(1)本文提出一个鲁棒的结构化图聚类模型。该模型设计了一个统一的学习框架,在学习鲁棒的结构化图的同时对样本进行聚类。该方法首先从原始数据中为样本学习新的嵌入表示来消除噪声和异常值的干扰,并基于新的特征表示通过自适应邻居分配的方式来学习样本相似度图。通过对该图的拉普拉斯矩阵施加秩约束,使得图中的连通分量个数恰好等于聚类簇的个数,进而使得该图获得理论最优的聚类结构。最终,通过直接划分学习到的结构化图能够获得样本的离散聚类标签,而无需借助任何标签离散策略。为了优化目标函数,本文首先将目标公式转换为更易求解的等价形式。然后,采用基于增广拉格朗日乘子的迭代优化方法来进行求解。通过在多个数据集上的对比实验表明,与现有的聚类方法相比,本文提出的方法具有更好的性能。(2)本文提出一个基于动态图特征学习的多视图聚类方法。该方法同时执行动态图的学习和特征提取,并直接使用提取的特征进行聚类。其中,动态图的学习可以自适应地捕获样本固有的多视图特定关系,同时,特征提取部分通过学习一个投影矩阵来将原始空间中样本的流形关系保留至低维空间中。本文提出一个有效的优化算法来获取目标函数的最优解,并证明了该算法的收敛性。与最新的基于特征学习的多视图聚类方法相比,本文提出的算法在多个公共数据集上都取得了更好的聚类结果。