稀疏样本自表达的子空间聚类算法

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:gm5w56002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实际应用中,子空间聚类方法可以从高维数据中寻找一个低维表示,用少量的数据就能去描述整个数据空间。这在很大程度上提升了高维数据处理的效率。目前已存在不同形式的子空间聚类方法有不同的适用环境。其中基于谱聚类的子空间聚类算法是应用较为普遍的一类处理高维数据的聚类方法。现有的基于谱聚类的子空间聚类算法通常围绕数据的局部或全局信息去构建数据的相似度矩阵,然后通过谱聚类对该相似度矩阵进行处理获得最后的聚类结果。这些算法主要的差异在于构建相似度矩阵的方法。一个好的相似度矩阵往往可以更好的体现数据子空间结构,而有利于处理高维数据中数据可能来自多个不同子空间的复杂情况。因此,本文给出了一种基于稀疏样本自表达模型的算法去构建相似度矩阵。该算法主要有以下几个创新点:1.该算法利用样本之间固有相关性找出一组与待测样本相关性强的样本去度量样本之间的相似度,以便更好的体现样本之间的相似关系。2.该算法首先通过l1-范数对自表达矩阵进行全局稀疏,使其更能体现出样本空间的低维子空间属性。然后进一步通过l2,1-范数对自表达系数矩阵进行行稀疏,使其对噪音和离群点更具鲁棒性。3.该算法提出了一种求解稀疏自表达模型的优化算法,该优化算法可以在处理高维数据时快速收敛到最优解,极大的减少了计算的复杂度,提高了子空间聚类的效率。
其他文献
在计算机辅助近景摄影测量系统中,用相机从不同方位对场景拍摄一组照片,在计算机上对该组照片上的目标点进行标记,获得各个标记点在不同照片中的二维坐标值,经过一系列算法,
云存储系统为存储大规模数据应运而生,其底层采用分布式文件系统作为存储平台。HDFS(Hadoop Distributed File Sysytem)是开源的云计算平台Hadoop提出的分布式文件系统,其设
互联网的快速发展,使得网络的规模越来越庞大,结构越来越复杂,网络用户数量呈指数级增长,而网络中的非关键业务的泛滥也导致网络的带宽资源被大量地消耗,影响了其他关键网络
随着电信企业的重组和3G牌照的发放,中国电信市场进入更加激烈的全业务竞争时代,如何适应日趋激烈的市场竞争环境,成为电信企业的重要问题。电信行业重组,中国移动面临着诸多
现代科技高速发展,人们渴望能用本民族语言以自然、直接的方式同计算机进行交流。因此,自然语言的语义分析研究具有十分重要的意义。由于自然语言的本身局限性和语言信息传递
动态电子商务作为第三代互联网模式已经成为当今IT业的热门话题之一。这种新型的电子商务模式可以减少人工参与的步骤,提高工作效率和用户使用的便利性。通过动态电子商务技
由于大气湍流的影响,以及各国深空探测脚步的加快,地基光学望远镜获得衍射极限图像的技术受到国内外天文研究人员的高度重视。幸运成像技术是通过对目标序列短曝光图像数据进
数据库系统的负载自适应是指数据库管理系统通过对负载的过滤和控制有效利用系统资源、满足负载性能要求的过程。自治数据库负载管理框架(AWMF:Autonomic Workload Managemen
随着经济的发展和社会信息化程度的提高,人们的生活质量和工作效率也越来越高,消费者对企业的服务质量也提出了越来越高的要求。企业为了争夺客户资源,必须准确把握住消费者的需
软件的可信主要体现在其行为的可信上,许多专家和学者越来越多地通过对软件行为的监测、信任关系的评价和异常行为的控制,来保证计算机系统能够安全的运行。由于软件行为可信