基于低秩性的子空间聚类算法研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:wing001019
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着大数据的发展,数据的获取途径变广,对数据处理的要求愈加严格。在计算机视觉领域,随着高维数据的爆炸性增长,现存的聚类算法受制于空间的复杂性已无法满足对精准度的要求。针对于子空间的映射特性,子空间聚类算法越来越受到人们的广泛关注。其中,结合图论的谱聚类算法是子空间聚类算法的一门重要分支,其本质上是将数据矩阵转化为无向图,按照割集准则切割子图完成聚类任务。由于生成的矩阵直接影响了聚类的准确率,所以如何处理数据集将其转换为理想矩阵变得尤为重要。现存的生成矩阵算法基于稀疏思想去除噪声构造矩阵,但是存在几个缺点,一是利用数据集生成的数据字典会包含数据集中的噪声,污染数据字典;二是生成的矩阵会将相似的特征错误编码为不同的系数;三是准确率有待提高。因此,在子空间聚类算法的研究中,如何设计高效、准确的矩阵生成算法是非常值得研究的问题。本文对低秩子空间聚类算法进行了研究,针对特定问题提出了两个改进子空间聚类算法:(1)针对数据字典存在噪声和准确率不理想问题,本文提出了基于稀疏性的稀疏低秩子空间算法。该算法利用稀疏约束,迫使数据集中的数据为其它数据的线性表示,完成对原始数据集的去噪处理,得到干净字典,进而使得生成的表示矩阵尽可能的具有理想对角结构。通过与现存的算法进行实验结果对比,表明了该算法具有良好的聚类准确率。(2)针对不干净字典和生成矩阵错误编码问题,本文提出了非负局部约束低秩子空间聚类算法。该算法在低秩约束基础上,结合鲁棒主成分分析,找到数据在低维空间上的最佳投影,完成对字典的去噪工作;同时加入非负约束消除部分相似特征被错误编码问题;鉴于加入多个约束后模型求解复杂性提升,引入线性交替方向自适应法迭代求解问题。从多个实验数据集的实验结果中表明,该算法在聚类准确性上相比现存算法有大幅提升。
其他文献
图像去雾是数字图像处理的重要内容之一,是图像增强的一种。传统的去雾方法只能去除图像中的雾霾,却忽略了图像中噪声的存在。在去除雾霾的同时,原来被雾霾覆盖的噪声却凸显
互联网、物联网、云计算等信息技术把我们带到了多元智能的网络化大数据时代。然而,大量的资源共享和实时的交流探讨使网络空间中的数据呈爆炸式增长,其规模巨大且形式多样,
湖北在建设文化强省的过程中,电影产业的持续健康发展是题中应有之意。对湖北电影进行定量研究,经过统计分析来描述湖北电影的特征,不仅可为其他电影产业研究者提供详实的数据,也是认识湖北电影的现状、推动湖北电影未来发展的基础。引言部分陈述了本研究的背景及意义,梳理了部分国内外电影产业研究的相关文献。正文第一章首先介绍了SCP理论的发展沿革,对哈佛学派产业组织理论、芝加哥学派和新奥地利学派产业组织理论、新产
近年来国家大力践行绿色发展理念,地震勘探领域中依靠炸药产生地震波信号的方法受到严格限制,已经越来越不能适应实际工程需要。电火花震源作为一种绿色环保震源,可以代替炸
随着移动通信的不断发展,越来越复杂的网络结构使得信息安全传输更容易受到威胁。基于密钥体制的高层安全协议和加密算法等方法虽然可以在一定程度上提升信息安全性,但无法克
本文主要研究沟道宽度缩小到5nm和6nm的新型U形沟道场效应晶体管,由于在亚十纳米级尺寸下,制造结型的半导体器件十分困难,且掺杂等相关工艺很难实现,故主要致力于制造工艺相
为了提高新一代高效视频编码标准(High Efficiency Video Coding,HEVC)的传输鲁棒性,使视频经互联网或无线通信网络等不可靠信道传输后还能获得高质量的重建,本文开展了第一
图像去噪问题可以分为加性噪声去除和乘性噪声去除。之前对加性噪声的研究更为广泛,后来随着图像中乘性噪声的普及,大家开始加深对乘性噪声的研究。随着变分方法在加性噪声方
近年来,云计算作为新兴产业,得到了迅速发展。外包计算作为云计算的一种重要形式,也得到了人们的广泛关注。在外包计算中,资源受限的终端能够将本地计算昂贵的任务交付给云来
近几年互联网信息技术的飞速发展给个人、企业、政府部门以及社会的方方面面带来的极大的便利,大量的电子数据随之产生,数据在各个领域的作用也变得更加显著。XML类型数据作