基于块对角表示的鲁棒子空间聚类算法研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:a619906915
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对高维数据进行挖掘是当前机器学习领域的热点。然而高维数据普遍具有高维、稀疏和噪音的性质,因此识别过程中容易导致“维数灾难”,从而影响识别效果。稀疏子空间聚类算法是一种有效的对高维数据进行聚类的算法。它首先学习输入高维数据在低维子空间上的表示系数矩阵,然后利用表示系数矩阵构造亲和力矩阵,最后将其输入谱聚类得到高维数据的聚类结果。当前,许多相关研究致力于学习到合适的表示系数矩阵,但却忽略了噪声项对子空间聚类的影响,也忽略了在得到表示系数矩阵后如何更好地构建亲和力矩阵。(i)如何设计一个具有鲁棒性,能有效对抗高噪声和对抗多种类型噪声的稀疏子空间聚类模型以及(ii)如何构造更有效的亲和力矩阵是本文研究的重点。基于块对角表示的子空间聚类算法可以直接约束表示系数矩阵呈现块对角结构,从而可以降低对数据质量的要求。本文通过对这种方法的研究,提出了基于块对角表示的鲁棒子空间聚类算法(RBDR)用于解决高噪声环境下的聚类问题,还提出了基于扩散的块对角表示的鲁棒子空间聚类算法(RBDRD)用于更好地学习亲和力矩阵。本文的主要工作概括如下:(1)提出了RBDR模型,用以解决未知类型高噪声对高维数据聚类的影响。主要创新点在于对数据的重构误差进行重加权,以及将重加权矩阵及其参数的优化过程设计成可直接计算的形式。在该模型中,通过对重构误差进行重加权,可以有效处理高噪声环境下的高维数据聚类问题,提升算法抗噪性,并且这种噪声处理方法无需具有对噪声类型的先验知识,因此更适用于真实条件下的复杂场景。同时,精心设计的模型优化方法可以降低模型优化复杂度和参数训练时间。(2)提出了RBDRD模型,用以解决亲和力矩阵学习不充分的问题。主要创新点在于引入了扩散的思想来学习亲和力矩阵。该模型通过采用扩散过程来迭代地充分利用局部邻域结构,每个成对的亲和力都通过与其他亲和力的亲和关系进行增强和重新评估,从而生成可以更好地表示数据的真实几何形状的亲和力矩阵。同时,扩散过程可以增强同一子图内边的连通性,有利于更好地进行图划分从而提升谱聚类的效果。
其他文献
党十九大报告上明确提出,要在我国实施乡村振兴战略目标,始终坚持以农业农村优先发展,结合产业兴旺,乡村文明风气建设,强化生活质量,使人们过上富裕生活,构建城乡统筹的总体
科技水平的不断提升和社会大的发展背景下,机电自动化已经成为发展的必然趋势,而机电自动化的广泛应用也已成为提升工作效率的有效手段,生产加工中的制造精度也有了很大进步
腮腺肿瘤是口腔颌面外科常见疾病。颌面部肿瘤中,其发病率非常高,治疗方法以手术切除为主。腮腺是最大的涎腺,色淡黄,质软,其解剖特点[1]:处于颜面部位、耳垂下前方,前界在下
本文针对传统Bootloader技术下载或升级应用程序繁琐的弊端,以恩智浦MC9S12XEP100微控制器为例,集成了融合用户程序和Bootloader程序的Bootloader系统,在此基础上,搭建了变速箱控制系统硬件平台,设计了变速箱控制系统的Bootloader上位机及控制系统。通过对变速箱硬件平台进行程序融合及用户程序升级,实现Bootloader系统功能测试。试验结果表明,所设计的Boo
BIM技术最初的起源不是电力工程领域,而是建筑设计。但随着该技术的发展与逐渐成熟,慢慢的应用到其他不同的领域,并推动不同领域的共同发展。文章主要研究BIM技术在电力工程
<正> 咯血的原因很多,但少见原因所致的咯血易于造成漏误诊,本文报告我们经治的6例,以引起同道注意。一、肺出血肾炎综合征(GPS) 例1:男,20岁。因咳嗽伴发热2月,咯血1天于198
本文以坚持农业农村优先发展总方针,以实施乡村振兴战略为总抓手,提高粮食综合生产能力为目的,努力推动“十大主攻”为手段,阐述了“十四五”期间长春市九台区现代农业发展方
目的:探讨宫内节育器(IUD)对高危人乳头瘤病毒(HR-HPV)阳性患者病毒清除的影响。方法:回顾分析2017年3月4日至2017年6月4日检测的206例HR-HPV阳性患者,其中使用IUD者53例,未
本文分析了河北省张承地区典型区域新能源利用现状及存在的主要问题,确立了今后的发展重点和方向是优先发展新能源种类,优化新能源的利用模式,在此基础上提出了相应的措施和
在技工院校中,班主任既是班集体的领导者、活动的组织者,也是引导学生健康成长的指路人,是帮助学生实现人生理想的指引者,是联系任课老师与学生的纽带,是学生与学校间沟通的