论文部分内容阅读
近年来,许多针对多视图数据的聚类算法被提出。然而现有的多视图聚类方法无论是针对完整的多视图数据还是不完整的多视图数据大多都认为跨视图的样本之间具有严格的一对一的匹配关系或没有关系。在实际情况中,一个视图的样本可能与另一个视图的多个样本有对应关系,现有的多视图聚类方法往往忽略了跨视图样本之间的这种复杂匹配关系。另一方面,实际生活中,每个视图都可能混入部分噪声数据,影响聚类效果。因此本文针对视图间的复杂匹配关系以及视图数据包含噪声的问题进行了研究。针对多视图数据之间多对多的复杂匹配关系问题,本文提出一种新的复杂匹配多视图聚类方法。该方法通过挖掘并利用视图间复杂匹配关系来获得视图间更丰富的互补信息和一致性信息,以此得到具有高度一致性的聚类结果。具体来说,该方法首先根据视图内部样本之间的近邻关系设计衡量跨视图样本之间的相似性函数,通过相似函数来构建视图间的复杂匹配关系矩阵;然后将关系矩阵应用于基于图约束的非负矩阵分解的多视图聚类方法中,建立视图间的加权投影关系,指导视图信息融合。最后我们给出所提方法的优化求解方案。针对多视图数据包含噪声的问题,本文提出一种新的针对噪声数据的多视图三支聚类方法。借助矩阵分解的思想,该方法将每个视图的相似性矩阵分解为干净数据部分和被噪声污染的部分,仅利用干净的数据进行后续的多视图信息融合。另一方面现有的多视图聚类结果大多是硬聚类表示方法,难以描述类与对象的不确定性关系,因此本文利用三支聚类表示方法获得最后的不确定性聚类结果。最后我们设计相应的对比实验去验证本文所提出的两个方法的有效性,实验结果表明,通过利用视图间的复杂匹配关系我们的方法无论是在完整的多视图数据还是不完整的多视图数据均能获得更好的聚类结果。在处理包含噪声的多视图数据上,我们的方法与对比方法相比能获得更好的结果。