谱聚类算法的研究及其应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:liuya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图论在许多数据挖掘应用中被当作自然数据模型,这是因为图论中的点_边结构和数据的实体_关系结构相一致。谱聚类就是建立在图论的基础上的无监督算法,它在聚类、图像分割等领域有较多应用。谱聚类算法处理数据集时,往往因其高维、复杂且有冗余而耗时耗力。由于深度学习近年来也获得广泛关注,它有能提取数据深层次特征的优势进而可以与谱聚类相结合。谱聚类算法首先需要根据数据集间的关系建立相似矩阵,该矩阵建立的好坏对后面的聚类效果有很大影响。所以如何有效利用数据集并构建相似矩阵,将其应用到图像分割上是本文主要探讨的问题。针对上述问题,本文具体所做工作如下:(1)谱聚类算法一般直接在原始数据的点对关系下构建相似矩阵,但原始数据往往高维复杂且有冗余。深度学习中的稀疏自编码模型正好可以提取数据集的高层结构,得到能反映原始数据最本质的特征,因此可以将数据预处理,得到深层次特征后再聚类。但是在建立相似矩阵时,并没有考虑到数据的流形邻域,且只是单一聚类。本文提出的算法通过对每个数据点进行线性重构,利用重构权值代替高斯核函数构建相似矩阵,同时将数据映射到聚类指标上以协调聚类指标,进而获得更精确聚类结果。(2)谱聚类算法聚类好坏很大程度上取决于相似矩阵的构建,传统谱聚类大多使用高斯核函数,但它对尺度参数很敏感。本文基于对尺度参数敏感的问题上,提出了新的基于加权密度的自适应谱聚类算法。该算法将数据点的加权K近邻距离作为尺度参数,尺度参数的倒数作为数据点所在密度,引入新的密度差调整相似矩阵,满足了同一流形或者同类数据密度接近的原则,使算法对参数不再敏感,而且对噪声也有一定的鲁棒性。(3)谱聚类算法应用到图像分割时,构建的相似矩阵是基于像素的,此时数据量过大,因此可以对图像做预处理。二次分水岭可以在保证原图像不被破坏同时得到较少像素的过分割图像,此图像正好可以用于后续的谱聚类工作。最后本文将得到的过分割图像作为图像输入,将基于加权密度的自适应谱聚类算法应用于图像分割处理中,通过定性与定量标准对算法做出评价。
其他文献
针对产品数字化设计过程中知识重用的特点,对设计知识进行了比较全面的分类,提出了产品设计过程中多形态知识的概念。研究了多形态知识集成的方法,给出了基于领域本体的多形态知
Fenton氧化技术是高级氧化技术之一,其产生的羟基自由基是一种强氧化剂,能够快速、高效氧化污染物,目前已在废水处理领域得到广泛应用。但传统Fenton法在处理废水的过程中产
《声类》是三国时李登所著的一部训诂著作,今已不传,文章将《慧琳音义》中的《声类》佚文逐一辑录,参校其他著作中的佚文,并对其内容、体例及价值进行详细剖析,冀展现《声类
银杏雄花芽生理分化期间花芽中赤霉素 (GA1 + 3)、脱落酸 (ABA)含量下降 ,玉米素 (ZRs)、异戊烯基腺嘌呤类 (iPAs)的含量以及ZRs GA1 + 3、iPAs GA1 + 3、ZRs ABA、iPAs ABA
随着我国城镇化的发展,建设项目的传统开发使得城市内的硬化面积不断增加,导致城市洪涝灾害的产生,造成了巨大的损失。硬化面积的肆意蔓延使得城市径流系数不断加大,径流总量与洪峰流量也大大增加,因此,在城市建设项目中大力采用透水地面和绿地成为城市水土保持的重中之重。在实际应用中,透水铺装与绿地的设计一般采取经验估算的方法。本文将对下垫面结构进行分析,探讨其变化对城市建设项目水文效应的影响,并作出评价。本文
伴随着各地民办幼儿园如雨后春笋般地纷纷涌现,其师资队伍也在不断扩充。毋庸置疑,民办幼儿园教师对民办幼儿园的发展做出了重要贡献,但在现实中也暴露出诸多问题,如“虐童事
近年来,信息技术的发展引发商业模式新变革,互联网平台应运而生,成为互联网创业的主要趋势,但会计实务中其收入确认存在诸多空白与难点。文章以财政部新发布的《企业会计准则
文章介绍了无线传感器网络技术和GPRS技术在矿井安全监控系统中的研究与应用,论述了无线传感器网络的原理和优点以及其在矿井安全无线监控系统中的设计基础。提出了矿井安全
20世纪三十年代中后期,我国乡村建设运动逐渐进入到了高潮阶段,一时间涌现出诸多乡村建设组织,同时自发和初步的有组织的互动也开始出现,三次全国乡村建设工作会议先后召开。