基于最小二乘回归的自适应子空间聚类方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:yangleiyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘领域,聚类作为一种重要的数据分析方法引起广泛关注,但数据规模不断扩大,数据结构日益复杂,维数也越来越高,很难使用传统的谱聚类技术对其进行分析,子空间聚类是针对高维环境下的信息进行处理的常用方法,可以在其中准确找到与数据子集相对应的低维子空间,去除无关信息对聚类结果的干扰。现有的自适应图正则化的低秩表示方法虽然可以对数据自适应的进行学习,同时保留数据的全局和局部信息,令得到的系数矩阵具有清晰的连通分量,但其使用低秩表示对数据信息进行挖掘,无法保证获得的系数矩阵满足集群效应,即具有块对角结构。为了更好的保证系数矩阵的块对角性,提高算法对噪声的鲁棒性,本文基于最小二乘回归子空间聚类技术,对单视图自适应图正则化低秩表示方法进行深入研究,使用Frobenius范数替代核范数逼近秩函数,增强系数矩阵的集群效应,使系数矩阵尽可能达到块对角结构并降低计算复杂度,再将其扩展到多视图场景。主要研究内容包括:(1)介绍了子空间聚类算法。首先,解释了子空间聚类的重要性,接着讨论了一些常见的子空间聚类算法,分析了几种算法的优缺点以及他们之间的联系,并对图拉普拉斯矩阵的相关知识进行概括从而引出拉普拉斯秩约束方法,该方法可以得到聚类结构清晰的系数矩阵,提升传统子空间聚类方法性能,最后对子空间聚类的相关优化求解算法进行介绍。(2)提出了基于最小二乘回归的单视图子空间聚类算法。现有的自适应图正则化的低秩表示子空间聚类方法虽然较好地解决了局部信息缺失、图结构不清晰的问题,但其使用低秩表示对数据信息进行挖掘,使得获得的系数矩阵过于稠密,不利于类簇划分,且利用核范数对系数矩阵进行约束,需要进行奇异值分解,计算复杂度高,难以用于现实应用。在本文中,我们提出了一种基于最小二乘回归的单视图子空间聚类方法,使用Frobenius范数而不是核范数来逼近秩函数,满足集群效应,即簇相关数据的系数近似相等,揭示更真实的子空间隶属度,提高聚类性能,降低计算复杂度。采用几个真实数据集进行大量实验,与相关主流方法进行比较,验证了本文算法的可行性。(3)研究了基于最小二乘回归的多视图子空间聚类算法。多视图子空间聚类算法集成了来自多个视图的信息,并考虑了不同视图的多样性。本文将提出的基于最小二乘回归的单视图子空间聚类算法推广到多视图数据场景,通过结合最小二乘子空间聚类与自适应图正则化技术,使不同视角的学习子空间趋向于该公共子空间,并最终对公共子空间施加秩约束,令其在保留各个视图局部结构的同时,获得良好的聚类结构。最后通过实验对该算法聚类效果进行验证。
其他文献
为了猫咪的健康,与它相关的事我们都要刨根问底!就像这次的问题"猫三联苗管啥病",我们绝不一知半解,一定要说明白,讲透彻!
期刊
从供应链的角度,在不同的销售模式下,构建生鲜电商的博弈模型,求解各成员的最优决策和最优期望收益,通过比较分析最优决策和最优期望收益得出选择不同销售模式的各种情形,以达到协调与优化供应链的目的。目前,根据现实背景和现有理论,生鲜电商的销售模式可以分为三类:(1)代理模式;(2)批发模式;(3)代理+批发模式,本文基于以上三种销售模式展开研究。随着平台经济的快速发展,国内知名电商企业加大了生鲜产品市场
随着全球经济的迅速发展,不断增加的能源成本、日益减少的化石能源储量以及逐步恶化的环境问题等,都一定程度上加快了世界范围向可持续发展的能源结构转变的进程,以太阳能为代表的可再生能源的高效利用是可持续发展的能源结构的重要部分。有机朗肯循环(Organic Rankine Cycle,ORC)发电技术在中低温太阳能热发电方面具有巨大的发展潜力和广阔应用前景,众多学者在工质选择、循环设备、循环性能、运行优
智能监控技术的发展关系到人们生活安全质量的好坏,越来越受到人们的重视。目标跟踪是智能监控技术的基础,例如,行为识别、轨迹追踪等都是以目标跟踪为前提的,跟踪算法性能的好坏直接影响后期监控效果,具有非常重要的研究价值。本文从智能监控需要自动对目标进行长时监控的需求出发,进行了多摄像头长时目标跟踪算法的研究与设计,从而实现对目标大范围长期准确地跟踪,有效提升监控质量。以下是本文具体工作内容,主要从长时跟
世界工业化的程度不断加深,世界能源体系的研究者们也一直在探寻更高效、环保的能源来应对急剧攀升的能源需求。基于锂金属电池发展起来的锂离子电池已经成为通信、运输和可再生能源领域的主要储能设备。但是自然界中锂资源的稀缺以及锂矿石品味较低限制了锂离子电池的发展和应用。而钠离子电池以其自然资源丰富、成本低的优势吸引了研究者们的目光。此外,钠离子电池与锂离子有着相似的储能机制,并且有望表现出更高的稳定性和安全
协作通信技术因其可靠的传输特性成为近年来被广泛研究的领域之一。缓存辅助中继系统的提出打破了传统协作通信中瓶颈链路的限制。与具有固定传输标准的传统中继相比,基于缓冲辅助中继的自适应链路选择协议能够获得更好的性能增益。但是,大多数现有的链路选择策略都是基于理想的信道状态信息(Channel State Information,CSI)设计的,而信道估计本身是非常复杂且较难实现的。此外,在一些复杂的场景
2004年石墨烯的成功制备,开启了石墨烯的黄金时代。随着研究的深入,二维材料展现出各种令人惊喜的性能,激发了科研人员的兴趣,开始探寻其他类似石墨烯的二维材料,磷烯、硼烯、锗烯、硅烯等单元素二维材料进入研究领域。本文选择石墨烯和硅烯作为研究对象,对其电荷输运性质进行研究。本文利用紧束缚近似理论结合格林函数,建立研究模型,利用Kwant软件对材料进行模拟运算,得到系统的能带、电导、态密度等数值结果,并
现代通信技术以无线通信为主,在过去数十年间飞速发展,推动着社会往信息共享和高效互联的方向不断迈进。受智能移动电子产品的影响,移动通信逐渐成为人们生活中通信方式的主流,从最初仅支持语音通话到目前能够满足各类数据传输业务,经过了几代的变迁。当前全球已经进入第五代移动通信(5G)时代,能够满足人们对高速率、低时延、大容量等性能的需求。低噪声放大器作为射频通信系统前端中的重要组成部分,5G移动通信的应用对
电子鼻是一种由传感器阵列和适当的气味识别算法组成的仪器,已广泛应用于食品安全检测、航天飞机和医学诊断等气味检测相关的各行各业中,并发挥着重要的作用。如何设计更高效且低成本的集成电子鼻系统是气味识别的研究热点之一。目前,集成电子鼻设计中,将原本普通电子鼻的传感器阵列模块和识别算法模块两个独立硬件和软件模块集成为一体。这种设计相较于普通电子鼻系统优势明显,避免识别算法使用额外的计算机硬件,降低了电子鼻
如今毫米波雷达被广泛应用于无人驾驶系统中。随着毫米波雷达技术的发展,车载毫米波雷达的分辨率越来越高,从同一目标处获得的数据量以及目标数据集的数据量也随之增多。同一目标的数据量增多能够让系统更准确地分析目标。但目标数据集数据量的增多会导致无人驾驶系统对目标数量的判断能力受到影响,因此需要利用合适的聚类算法处理车载毫米波雷达的目标数据集来得到正确的目标数量。车载毫米波雷达目标数据集的数据密度不均匀,并