论文部分内容阅读
随着网络技术的飞速发展,信息感知和网络应用产生了巨大体量的数据,大数据时代已经来临。目前,网络大数据中绝大部分是无标签的数据,如何挖掘隐藏在大数据中的有价值信息,获取数据的语义信息是大数据处理和利用面临的最大挑战。而无监督的聚类分析方法作为获取数据类别标签的有效方法,是数据处理和分析方面的研究热点,特别是子空间聚类方法,因为其较高的聚类性能,受到研究者的广泛关注。近年来,最具代表性的子空间聚类方法是低秩表示(LRR)和稀疏子空间聚类(SSC)方法,其核心思想是来自于某个子空间的数据样本可以由该子空间的其它数据样本线性表示,并且表示系数具有低秩和稀疏特性。由于低秩表示(LRR)和稀疏子空间聚类(SSC)方法在高维数据的表示和聚类中具有良好的性能,因此在许多场合得到广泛应用,包括人脸图像、手写字和文本聚类等。虽然低秩表示(LRR)和稀疏子空间聚类(SSC)方法获得了较好的应用效果,但面对实际比较复杂的数据,该方法忽略了数据的一些结构属性,而这些属性对于聚类具有较大的影响。例如,实际应用中许多待聚类的数据具有序列特性,包括岩心光谱数据、视频、动作序列等。但现有的子空间聚类方法很少利用数据的序列属性进行聚类。为了更好地体现和描述复杂数据的结构属性,并获得理想的聚类效果,本文深入研究了面向序列数据的稀疏低秩子空间聚类方法,通过描述数据的序列属性,在现有低秩表示(LRR)和稀疏子空间聚类(SSC)方法的基础上,提出了具有序列约束的低秩表示(LRR)和稀疏子空间聚类(SSC)方法,并通过大量实验验证了所提出方法的有效性。论文的主要工作归纳如下:(1)提出了一种基于对角块先验条件的有序子空间聚类方法,利用子空间假设下数据自表示系数构建的关联矩阵成对角块的先验知识,结合序列数据的序列属性构建了一种新的稀疏表示模型,实现了有序子空间聚类。(2)提出了一种非刚性运动物体的有序子空间聚类方法,建立非刚性物体运动的三维重构与有序子空间聚类的统一模型,模型中有序子空间的构造提高了三维重构的精确性,而三维重构又提高了子空间的聚类性能。