基于局部主成分分析和自步学习的谱聚类算法的改进研究

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:a370412412
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的飞速发展产生了海量的数据,从这些数据中提取出对实际生活有用的信息成了研究的热点问题。聚类作为一种经典的无监督机器学习方法因其可以获取数据的内在信息而被广泛研究。现实数据集通常质量参差不齐常会含有噪音样本和离群点,并且数据集的实际分布通常较为复杂。此外,在收集和存储数据的过程中还可能会出现数据部分信息缺失。而大多现有的谱聚类方法并未将这些问题考虑在内,导致模型的鲁棒性不强。本文重点研究具有复杂分布且含噪数据的聚类问题,旨在提高传统谱聚类的鲁棒性,特别对缺失和含噪声数据的处理能力以此来提升聚类效果。本文具体研究内容如下:(1)提出一种基于局部主成分分析的改进谱聚类算法。具体地说,本文首先通过自动学习对数据集中的样本进行挑选以削弱低质量样本对聚类模型的影响;然后应用局部主成分分析使得谱图分解后的低维数据较好地保留原始数据的全局和局部信息;接着使用连通图分解算法在不需要指定聚类个数的情况下输出聚类结果,最后通过距离远近对剩余样本进行聚类划分。(2)提出一种基于缺失值和自步学习的一步谱聚类算法。具体地说,使用一步谱聚类模型,将传统谱聚类的多步骤进行了融合,消除了中间步骤可能带来的累积误差;然后在此基础上融合对缺失值的处理,使得提出模型充分的利用缺失样本中的剩余信息;接着引入自步学习对样本进行重要性排序,在不同的学习阶段使用不同质量的数据缓解离群点和噪音样本对聚类模型的影响;最后对得到的聚类结果进行谱旋转,弱化随机超平面对谱图划分的影响从而使得到的聚类结果性能更佳。本文主要针对传统谱聚类算法需要预设聚类个数和无法处理含噪的缺失数据集等问题进行了改进研究。研究使用了局部主成分分析、连通图分解、自步学习、一步谱聚类、缺失值处理等技术。通过不同的评价指标在多个真实数据集上进行实验分析,结果显示本文提出的改进谱聚算法在各项评价指标中均优于所选的对比算法。在未来的工作中,本人考虑将神经网络的特征提取功能与传统聚类方法进行结合进一步提升算法性能。
其他文献
盖革模式APD(Avalanche Photodiodes)阵列激光雷达成像具备灵敏度高、精度高、集成度高等优势,这使得激光雷达领域远距离目标探测成为当前研究热点之一。本文主要针对传统距
随着科学技术的不断发展和现代工业的实际需求,芯片技术朝着高度集成和小型化的方向发展,这导致近年来芯片产生的热通量逐渐增加,甚至存在热流密度超过1000 W/cm2的局部热点
卫星光通信是一种空间光通信技术,与传统的微波通信相比,卫星光通信具有诸多优势。随着科学技术的发展,人们对卫星通信速率的需求不断提高。零差相干探测相比于直接探测,具有
近些年来,电化学超级电容器发展迅速,由于它们具有功率密度高、充放电时间快、循环稳定性好等特点,广泛应用于便携式通信、运输、电力和航空等领域。电极材料是超级电容器最重要的组成部分,其性能的优异能够直接决定超级电容器的电化学性能,因此,对超级电容器电极材料的研究极其重要。三氧化二锰(Mn2O3)的理论比电容可达1229 F·g-1,具有丰富的电化学反应性、成本低、环境友好,自然储存量大等诸多优点,是一
1.引言三维探地雷达探测是一种高效、无损的地球物理方法,可清晰描绘目标体的轮廓和位置,并对其延伸方向进行追踪,具有高分辨率、地下目标体真实归位的优势。三维探地雷达由
会议
贵广高铁途经贵州省贵定县昌明镇,并在此设立尖山营特大桥。现场监测数据显示大桥桥墩在雨季出现抬升,旱季又会向下沉降。桥墩(台)位移变化严重超出了高铁设计规范,对梁轨结构的安全存在着不利影响,也使得高铁经过尖山营特大桥时要限速。理论分析及膨胀性试验表明桥位异常升降的主要诱因是桥墩下覆膨胀岩土层的胀缩。拟建贵南高铁也要经过该地区附近,为了对贵南高铁的勘察、设计、施工以及后期运营提供依据,并且由于现如今对
内蒙古自治区作为我国北方玉米主产区省份,在玉米临时收储政策正式调整为“市场化收购+生产者补贴”机制的改革背景下,提出研究内蒙古土地流转对玉米生产技术效率研究的问题,
行人再识别指的是利用计算机视觉领域的知识,在不相交的摄像机区域中寻找特定行人的技术。行人再识别因其在公共安全领域中有着极为重要的应用价值,备受产业界和学术界的关注
叠层有机发光二极管(Tandem Organic Light-emitting Diode,叠层OLED)由两个或两个以上的独立电致发光单元经过电荷产生层串联组成,因在低电流密度下可实现高亮度、高效率和长
图像去雾一直以来是计算机视觉领域的研究热点之一,随着科学技术的进步和发展,对清晰图像的要求也越来越高。如何从雾天模糊图像中复原出清晰可见的无雾图像成为了研究的重点