基于近邻分析的谱聚类算法研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:lokenhvj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今信息时代的大环境中,我们所要面对的是在大量信息流下产生的海量数据的归纳与整理的问题;如今在高速的信息生成、传送、保存的过程中都会产生大量的数据信息,而且随着人们对信息精度的要求不断提高,信息数量大幅度增长,其维度也成倍增加。这些变化不但使得在海量数据库中提取有效信息变得愈发艰难,而且使得人们对数据集的提前标记也成为了无比困难的事情。因此,对无标记数据的有效信息的提取已成为当今信息时代发展的必然的趋势。聚类是近些年来无监督学习的热门方法之一。而谱聚类又是聚类方法研究中的热点,并且通常表现出良好的聚类性能。谱聚类大致有以下几个核心步骤:先预处理构造表示数据集的图形得到数据集的相似矩阵。再谱表达即根据相似矩阵,得到相应的正则化或不规则拉普拉斯矩阵,计算L的特征向量。首先要对拉普拉斯矩阵进行特征分解,得到前k个特征值及其对应的特征向量用以形成特征空间,最后使用算法(例如K-means算法等),最终获得聚类结果。其中,如何构造相似度矩阵是谱聚类的关键步骤,主要决定聚类的性能。然而,传统的谱聚类算法模型不能很好地考虑样本数据集合的内部分布结构,很难真正的反映样本点与点之间的连通性与相似性。在全连接图种使用欧式距离,基于每个独立的样本的样本间的关系都是直接获取,所建立的样本度量也是基于全局。样本之间的关联比较单一,尤其是对于多尺度的数据集和具有流形结构的数据集来说很难充分描述样本间的局部特征,使建立的相似性特征描述不完整,不能完全反映样本之间真正的关系和潜在数据结构。为了解决以上问题,基于近邻图分析,本文对谱聚类算法进行分析和研究,主要做了以下工作:第一,针对以上的问题,受密度聚类的启发,我发现通过找到数据之间的最近邻关系优化相似矩阵,不仅能更好的反映数据之间真实的邻域关系,并且能得到更好的聚类效果。因此提出了一种新的基于k邻域关系和互近邻关系构建相似矩阵方法而非传统的用k近邻图或者全连接图构建,通过得到一个新的权重矩阵去更新相似度矩阵从而提升谱聚类效果。我们的新方法中,该模型不仅使用简单方便,还能考虑到数据的局部和全局结构。使用k近邻和互k近邻关系图可以同时发现数据的密度和连通性信息,发现数据集中包含的密度信息,反映数据的内在结构。关于聚类结果,我们提出一种新的检验方法,可以使用eigengap值是否变得更大去检验,因为根据矩阵扰动理论可知,本征间隙值越大矩阵分区越稳定聚类结果越好。第二,本文提出一种新的自调整的高斯核函数,并结合权重关系矩阵,以进一步提升该方法的性能。其中自适应地确定高斯核函数的参数和考虑了权重关系度量,弥补了高斯核函数中参数手动取值的困难和原本仅使用欧氏距离计算的高斯核函数带来的对数据样本的局限。使它可以从多尺度数据中准确地提取流形结构。第三,我们将提出的方法多方位的与现有的聚类算法进行比较,通过人工数据集和UCI数据集、MNIST手写数字数据集的实验结果可以得出,该算法对于人工和真实数据集都有较好的性能。此外还表明,所提出的方法可以从多尺度数据中更准确地提取流形结构,并且对高斯核参数的选择不太敏感。
其他文献
学位
轻量化设计可以实现多方面优化轨道列车的目的,是轨道交通领域关键技术之一。目前在制造中主要采用铝合金材料来实现列车轻量化,但在轨道交通应用中采用铝合金减重已经出现瓶颈。镁合金作为金属结构材料,具有密度小,比强度和比刚度高且切削性能良好的优点,并且镁资源丰富可以满足开发和利用。但镁合金的耐腐蚀性能较差,是限制镁合金在轨道交通应用的主要问题。冷喷涂涂层制备技术可有效的防止镁合金被腐蚀,而且该技术能源消耗
学位
温芯盒法与传统的热芯盒法相比具有芯盒温度低、现场气味小、芯砂发气量小、型芯尺寸精确等特点,有利于环境保护以及节能减排,开发温芯盒法制芯材料及工艺具有一定的理论研究意义以及实际应用价值。本文主要针对温芯盒呋喃树脂的合成工艺、树脂的改性工艺和复合固化剂的制备工艺等内容进行研究。本文对温芯盒呋喃树脂的基础合成工艺进行单因素探索试验,在此基础上进行了正交试验得到了温芯盒呋喃树脂最佳合成工艺为:酚醛摩尔比为
为了实现高温热端零部件的连接和修复,完善第三代单晶高温合金的钎焊研究体系,本文采用镍基合金钎料JSSNi60A和高熔点合金粉混合制成的混合粉末钎料,在1240℃/30min的钎焊工艺下对第三代单晶高温合金进行钎焊,接头间隙为200μm,并对接头进行焊后热处理。在此基础上,研究了高熔点合金粉的粒度以及比例对钎焊接头的微观组织和力学性能的影响,并分析了接头在热处理前后的组织演变过程、元素分布变化和力学
2060-T8铝锂合金具有低密度、高比强度及较高的低温性能,被广泛应用在航空航天行业,是国产大飞机蒙皮的主要材料。使用熔化焊方法对其焊接时,会出现气孔、裂纹、合金元素蒸发等焊接缺陷。搅拌摩擦焊(Friction Stir Welding,FSW)是一种固相连接技术,其焊接过程热输入低的优势能够有效避免熔化焊导致的焊接缺陷。飞机蒙皮是三维曲面零部件,使用柔性高的机器人FSW对其焊接时具有明显的优势。
猕猴桃属雌雄异株大型落叶木质藤本植物,在全球范围内均有种植。猕猴桃营养丰富,经济效益高,被称为“维C之王”。猕猴桃在不同生长发育阶段,温度、光照、降水、土壤和地形条件都会对其生长产生影响。猕猴桃适宜于在温暖湿润、阳光充足、土壤适宜、排水良好的环境生长,萌芽期的晚霜、大风灾害,生长期的旱、涝灾害,成熟期的霜冻、降雪灾害,均对其生长发育影响较大,因此,选择合适的区域种植猕猴桃,提升猕猴桃种植户应对气候
电解质溶液在日常生活中极为常见,同时在工业、医药、能源、环境等热门领域无处不在。然而,阴离子/阳离子的水合作用,离子之间的静电吸引,以及离子与溶剂之间的相互作用使电解质溶液的实际行为在某种程度上偏离理想溶液。因此,对电解质溶液的相行为和热力学性质的深入讨论对于理解电解质溶液的性质至关重要。本文选择了 MCl(M=Na,K,Rb,Cs)+TMU(四甲基脲)/NMP(N-甲基吡咯烷酮)+H2O三元体系
电解水制氢由于过程零碳排放且获得的氢气纯度高,被视为目前最有竞争力的制氢途径之一。电解水过程由两个半反应——阴极析氢反应(HER)和阳极析氧反应(OER)组成,这两个半反应的高过电位及缓慢动力学严重限制了电解水的效率,因此迫切需要开发高效、低成本的电催化剂以加快HER和OER反应动力学、减少能源消耗。过渡金属材料,如过渡金属合金、磷酸盐、氧化物、硫化物等,因其良好的电催化活性引起广泛关注。但研究发
电力变压器是电网中实现远距离输送及电能分配的重要电力设备,其稳定性对电网安全至关重要。绕组是电力变压器最容易发生故障的部件之一,其中机械故障所占比例最高。绕组机械状态的改变是不可逆转的,最终导致变压器抗短路能力下降,在遇到外部突发短路冲击时容易发生损坏,使生产和生活用电受到影响,造成重大经济损失。振动分析法从电力变压器绕组的机械动力特征出发对绕组机械故障进行诊断,可以实现在线监测及带电检测,避免了