非负矩阵分解算法及应用研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:cherrychenghui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非负矩阵分解算法是一种有效的特征提取及数据低维表示方法,其分解过程和分解结果具有可解释性,利用乘性迭代规则能够快速求解。因此,在特征提取、分类及聚类任务中有广泛的应用。与PCA、LDA等算法提取的全局特征相比,NMF算法提取数据的局部特征,可以解释为原始数据是所有局部特征的纯加性组合,这种分解特性更符合人类视觉的认知方式。随着对NMF算法研究的不断深入,专家学者通过对特定场景中的潜在数据结构进行分析,从而将NMF算法合理应用到不同场景中。NMF算法有三个重要的改进方向:一是在目标函数中加入额外的约束项或惩罚项,如稀疏性约束、正交性约束、图正则化约束等,以提高在分类及聚类任务中的性能;二是对分解形式进行重写,如将单层的矩阵分解扩展成多层的矩阵分解,以得到数据中更加丰富的层级结构特征;三是与其他算法相结合,将非负性约束作为提升算法性能的有效方式。本文针对非负矩阵分解算法在特征提取及数据低维表示进行研究,提出了两种有效的NMF算法,使其在图像分类及聚类任务上的性能有所提升。本文的主要工作如下:(一)提出了图正则化稀疏判别非负矩阵分解算法。引入了标签信息,将无监督的NMF算法扩展为有监督的NMF算法,以提高算法的判别性能;结合了图正则化约束和最大间距准则来提取更加局部化的特征;并结合稀疏性约束,进行有效的特征选择。不同的约束项发挥了不同的作用,约束项之间是可以相互补充的,适当的结合不同的约束项,能够在特定问题中得到更好的效果。(二)提出了基于自步学习方法的图约束非平滑非负矩阵分解算法。用L2,1范数表示的目标函数代替以欧式距离表示的目标函数,提高对噪声数据的鲁棒性;引入平滑因子矩阵,以提高分解后两个子矩阵的稀疏程度;将自步学习作为一种特殊的dropout方式,减少基特征之间的相互影响,得到更加稳定的分解结果。本文给出了算法的基本模型及优化求解方法,并在ORL、AR、COIL20等数据集及添加噪声的数据集上进行图像分类及聚类实验。实验表明,本文所提出的两种改进的NMF算法在图像特征提取及数据低维表示中是有效的。
其他文献
一、脱硝催化剂的失活机理当催化剂运行一段时间后,不可避免地因为各种复杂的物理和化学作用而失活。再加上我国燃煤电厂多燃用劣质煤、运行煤种频繁变化以及燃煤成分复杂的
会议
现代高层建筑为了追求大空间,不再使用截面面积较大的“胖柱”,而是选用承载力及延性均较好的钢-混凝土组合柱。在钢骨-钢管混凝土柱的基础上,本文提出了一种新的钢与混凝土
使用机器人装配电缆等柔性工件是进一步提高生产效率和降低人力成本的关键。许多工业领域已经实现了用机器人自动组装工件。由于像电缆、柔性电路板、密封圈这类柔性工件在受
不平衡数据是指在样本集中各类样本的数量差异悬殊的数据集,类别不平衡学习算法的目的是提高传统分类器在不平衡数据上的分类性能。而且,在单台机器上难以有效地处理大规模的
随着生物交叉网络信息技术的快速发展和多种生物基因的不断增多,大量蛋白质数据出现,使得研究蛋白质网络功能表达、作用环境、产生的影响、组成结构成为了生物网络研究的要点
在矿山生产过程中,矿山储量动态监测是一项重要的基础性工作。每年度进行矿山的储量数据更新工作,有利于掌控到矿山企业矿产的真实资源储量和矿山开采回采率、选矿回收率及综合利用率,是合理利用资源,保护矿产资源有效途径。论文以腾冲市矿山储量动态监测系统建设为总体目标,研究了储量更新的工作流程和数据交互格式。基于软件工程思想,通过需求分析、系统设计和系统实现等步骤,设计并实现了腾冲市矿山储量管理系统。该系统使
市面上针对残疾群体生理缺陷的辅具产品有很多,但真正关注残疾人心理需求的产品却十分有限。本研究从残疾人心理出发,研究残疾人在社会生活中,尤其是使用辅具产品时的心理状
背景:人工智能(Artificial Intelligence,AI)在医疗领域的发展迅速,逐渐由实验室研究进入临床实践。IBM公司开发的沃森肿瘤(Watson for Oncology,WFO)在2017年开始应用于中国
随着社会的不断发展与进步,传统的化石能源因为其储量有限,对环境污染较大等因素,将会逐渐退出人类未来的能源结构。而生物质能作为一个储量巨大,清洁的可再生能源将会扮演越
随着社会的不断发展与科技的持续进步,人们的物质生活需求逐渐走低,反而对非物质生活追求逐渐提升,这时室内服务机器人渐渐得到了人们的关注。本课题的研究是以服务机器人项