基于FCM的非负矩阵分解在图像聚类中的应用研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:feya520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像聚类是将数据划分成若干簇,并使得簇内数据彼此相似,而簇间数据不相似的过程.非负矩阵分解(Non-negative Matrix Factorization,NMF)作为一种有效的降维方法,可以很好的挖掘数据的潜在结构特征,降低数据维数.因为NMF有较强的可解释性,使其成为处理聚类任务的一种有效算法.但是,传统的NMF还是存在一些不足,特别是对于复杂的高维数据,我们要求能够保留原始数据的结构信息,这使得其收敛速度和聚类精度有待进一步提升.此外,NMF本质上是一种降维技术不能直接用于聚类.模糊C-均值算法(fuzzy C-means,FCM)是一种非常经典的聚类算法,然而,FCM对复杂结构的高维度数据、初始值和噪声的敏感性都导致其聚类效果下降.基于NMF和FCM,本文提出了三种新的图像聚类算法.第一,针对传统FCM算法在处理复杂结构的高维数据集时会产生大规模计算量,从而导致聚类效果下降的问题,提出了一种新的聚类算法--基于非负矩阵分解的修正模糊聚类算法(MFCM-NMF),该算法是利用了非负矩阵分解进行降维,提取数据的本质特征,保留作为模糊聚类的聚类中心,将NMF与MSFCM相结合提出了新的目标函数并采用交替迭代算法进行求解,且在迭代过程中基于三角不等式过滤出在下一次迭代中不改变其最近聚类中心的那些样本,采用新的隶属度更新公式,减少计算量,提高聚类性能.第二,一般的FCM的初始值为随机赋值,对FCM的聚类效果有很大的影响.为此,我们提出了基于局部约束非负矩阵分解的修正模糊聚类算法(MFCM-LCNMF),该方法是利用非负矩阵分解将数据的维度降低得到数据的低维表示,并利用数据的低维表示作为FCM的原始数据,降低初始值的影响.但是非负矩阵分解也无可避免地会损失一些信息,为了更好地保存局部几何结构,将局部线性约束加入目标函数中.第三,FCM对于噪声的敏感性不可避免地导致了聚类效果的下降,为了提升聚类效果,将具有噪声残差估计的L2,1NMF与改进的FCM相结合,利用L2,1 NMF的鲁棒性和噪声约束项,削弱了噪声对数据聚类的影响.此外,由于L2,1 NMF的低维表示是连接L2,1 NMF和FCM的枢纽,为了获得更精确的低维表示,我们利用新的度量构造了一个新的局部约束项.基于此,提出了通过L2,1 NMF和局部约束进行鲁棒去噪FCM聚类(RFCM-L2,1 NMF).对于上述的三种方法,通过求解其优化模型给出了迭代更新公式,并通过实验验证了这些方法的有效性,提高聚类效果.
其他文献
报纸
带噪声回归估计是非参数统计的重要研究方向之一,在统计学、社会学以及大数据处理等领域中具有极其重要的应用价值.小波因其独特的局部时频分析特性而被广泛应用于回归估计.受Donoho,Chaubey,Chesneau等人工作的启示,本文重点讨论了强混条件下带噪声回归函数的小波点态估计.首先,利用投影方法构造了线性小波估计器,并在各向同性Besov空间Bp,qs(H)中给出了该估计器在强混样本下的lp(1
学位
随着大气污染精准治理工作的推进,强污染源逐渐消失,大气治理工作过度到弱源时代。单一控源的治污思路已不适应当下的局面,环保部门的大气治理工作依旧困难重重。ZY公司是大气治理的第三方服务商,主营产品是大气环境监测设备以及数据分析服务,核心客户是各地生态环境局。本文主要介绍7P营销理论、大气资源管理体系等相关概念,并运用PEST环境分析工具、SWOT综合分析工具以及波特行业竞争结构模型对ZY公司进行整体
学位
近年来,随着我国民用航空运输业的快速发展,乘坐民航飞机已经成为一种非常普遍的出行方式。但航空运输服务质量一直达不到令人满意的水平,特别是航空行李托运问题,在民航运输服务问题投诉中占比很高,严重影响了乘客对航空运输服务的满意度,降低了航空运输业的市场竞争力。本文以A航空公司为例对行李托运问题进行了研究,首先分析了提高行李托运服务质量的重要作用,结合国内外相关研究成果,阐述了本文研究的重要意义,介绍了
学位
本文是一篇英译汉的翻译实践及报告。翻译原文节选自于韦斯屈莱大学网络安全教授马尔蒂·勒托《网络安全:分析法,技术与自动化》(以下简称《网络安全》)。该书是马尔蒂·勒托于2015年主编的有关电子科技类的论文集。翻译忠实原文,既对文中信息进行了保真处理,又进行了交际处理,让中文读者(包括专业电子科技文本读者)充分接受本书所传达的内容,了解更多国外电子科技方面的知识,扩大其知识面。本翻译报告内容主要包括五
学位
核心分解是一种基础的图挖掘问题,能够度量网络中节点的重要程度并提取指定Core N umber的k-core子图结构。核心分解有着大量的应用场景。在社交网络中,网络结构的稳定性与用户参与度息息相关,Core Number作为一项重要指标可以用来评价用户的参与程度。k-core也常被用作图着色和社区挖掘等复杂图计算问题的预处理策略。核心分解作为一种线性复杂度的基础问题,上游任务对其算法性能有着较高的
学位
随着中国经济的快速发展及人口老龄化逐渐来临,慢病人群也越来越多,且中国人的第一死亡因素就是心脑血管相关的慢性疾病,国内高脂血症的慢病人群数量庞大。本文以A公司降脂领域产品营销现状为研究对象,运用市场营销管理的相关理论进行综合分析论述。通过分析当前国内医药市场的宏观环境,结合降脂产品的市场营销环境,通过运用SWOT分析,结合A公司自身的优势与劣势,以及面临的市场机会和威胁,分析指定相应的营销策略。同
学位
随着互联网和视频采集技术的快速发展,网上产生了大量的视频数据,如何利用智能化技术识别视频中的人体行为成为了迫切的需求。人体行为识别在许多方面具有十分广阔的应用前景,许多研究人员对其进行了深入的研究和探讨,并且取得了显著的研究成果。目前,基于监督学习的深度卷积神经网络在人体行为识别任务上具有很好的应用效果,但是这类方法的性能在一定程度上依赖于标签数据的数量和质量,在只有少量标签数据的情况下,这类方法
学位
重复标量非线性是一种典型的非线性系统描述方法,它通常表示一类具有非线性特征的函数,如半线性函数、正弦函数、饱和函数、双曲正切函数以及广泛应用于神经网络的激活函数等.重复标量非线性系统是一类由包含重复标量非线性的离散状态方程描述的非线性系统.在实践中很多问题都可以建模为重复标量非线性系统,如递归人工神经网络、超立方体神经网络以及具有饱和非线性的数字控制等问题.因重复标量非线性系统的参数是时不变的,这
学位
本学位论文主要研究来源于多元统计分析中的一类含列正交约束矩阵迹函数极小化模型min c+tr(AX)+(?)tr(BjXCjXT)s.t.X∈Rn×p,XTX=Ip,其中A∈Rp×n(p≤n),B∈Rn×n,Cj∈Rp×p(j=1,L,m)为给定矩阵,c为不依赖于未知变量X的常数.该模型的特殊形式广泛应用于多维标度分析中DEDICOM模型和正交INDSCAL模型最小二乘拟合等问题中。该学位论文结合
学位