基于误差图和加权矩阵的非负矩阵分解正则化及其应用研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:csharpguy2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化的普及,海量数据逐渐产生,数据表现出高维,多源和异构等特点。拥有这些特点的数据给机器学习,模式识别,计算机视角,信息检索等领域带来了严峻的挑战。为了较好的从数据集中获取有用信息,通常采用矩阵分解的方法,具体表现形式为将一个数据矩阵分解为多个低维矩阵表示的形式,以此达到降低数据维度的目的。非负矩阵分解是基于局部的、具有较强的心理学和生理学意义,以及具有可解释的非负纯加性特征的矩阵分解算法,自提出以来被广泛应用在各种高维数据处理上,其中一个重要优化改进是结合流形结构背景提出的图正则化非负矩阵分解。然而,图正则化非负矩阵分解算法及其之后的一系列优化改进,均不能保证降维后的数据空间流形结构真的对应降维前数据的空间流形结构,也难以保证多维数据中欧式距离近的样本是真的特征接近。本文针对上述的不足,提出相应优化改进方法,并将其应用到高维数据聚类。主要研究工作和创新如下:1)针对图正则化非负矩阵分解中仅基于局部不变性假设进行流形降维,难以确保数据降维后,其流形结构依旧不发生变化的问题,提出基于误差图的非负矩阵分解方法。通过构建误差权重图,将每次降维后的流形结构与降维前的流形结构进行对比,然后根据误差权重图的反馈,对降维后的系数矩阵进行相应调整,使误差权重矩阵趋于稀疏化。在四组不同的数据集上实验结果表明,该优化方法,不仅能在降维过程中维持数据集流形结构的稳定性,使数据降维效果更加准确,而且当数据样本维数越大时,聚类精度提高的越高。2)针对图正则非负矩阵分解中采用欧式距离的方式来计算两个样本点之间的距离,会均衡化不同特征之间的差异,从而使聚类结果变得不准确的缺陷,提出基于加权矩阵的图正则化非负矩阵分解。该方法采用点乘的方式对系数数据矩阵中大值进行加强维护和小值进行缩小惩罚,有效降低特征突出部分信息的缺损以及减小了欧氏距离计算导致的信息均衡化这一缺点。实验结果表明:基于加权矩阵的图正则化非负矩阵分解方法是有效的,并且在所有NMF的图正则化上具有推广性。总结,本文从高维数据降维过程中的流形结构维护,数据特征保护两个方面进行展开,相应提出两种基于非负矩阵分解的优化方法,用于提高算法准确度。通过算法的理论推导以及在真实数据集上的实验,都表明本文所提出的优化方法的可行性与有效性。
其他文献
当今世界的我们正在面临能源短缺的严峻问题,人们对于能源的过分开发已经对我们的生活造成了极大的威胁,对环境的污染也越来越严重,这种现状就促使着人们意识到了应该正确面对能源和环境问题。面对这一严峻问题,涡轮增压技术的研发为解决环境和能源问题提供了极大的帮助。机车制造研发技术已经成为了人们高度关注的话题,涡轮增压技术无疑是这一领域的关键核心。涡轮机是涡轮增压系统中最重要的部件之一,涡轮机的性能好坏直接影
随着新一轮电力体制改革的不断推进,售电公司在放开的售电侧中已成为不可或缺的市场主体。新电改致力于形成市场化竞争格局,电网企业组建售电公司参与竞争是必然趋势,也是对于本次改革所做出的积极应对。面对着愈加激烈的竞争态势,如何实现长期、稳定的盈利是电网企业售电公司现阶段必须重视的问题。因此,当前需要研究满足市场需求且符合自身能力的盈利模式,以及通过构建经营效益评价指标体系和评价模型,综合衡量公司经营效益
计算思维是信息技术学科核心素养的主要组成部分,计算思维的培养是中小学信息技术课程改革的核心目标。在数据与计算、算法初步、开源硬件项目设计等课程模块的教学中,图形化编程工具已成为开展计算思维教学实践的重要载体。图形化编程以其形象直观的积木式编程方式和蕴含的抽象和符号化的编程思维,使学生在保留算法核心思想的同时减轻认知负荷,从而留出更多认知资源聚焦于计算思维能力的提升。针对当前中小学计算思维培养缺乏体
学位
21世纪初期,我国资本市场尚不成熟、上市门槛较高,很多尚未盈利的企业选择到海外上市募集资金,掀起了一波赴美上市浪潮。近年来,中概股在海外市场频频遇冷,甚至面临极大的政治风险,反观中国资本市场正飞速发展、政策利好消息频出。在这一背景下,以暴风科技、完美世界、巨人网络等为代表的一众在美中概股纷纷开启了回归之路。中概股的集体回归在为公司自身和资本市场带来机遇的同时也催生了风险和隐患,对我国资本市场造成较
学位
随着电磁环境变得日益复杂,外界电磁干扰信号耦合进入电子设备造成危害已经成为一个极为普遍的问题。由于电子系统的复杂性升高,各种电磁干扰耦合到系统中的不确定性、随机性以及敏感性也越加明显,而电磁效应研究中统计分析显然优于确定性描述。随机耦合模型(Random Coupling model,RCM)作为一种统计方法,在电磁兼容、统计电磁学、抗辐射加固和高功率微波效应研究领域有着重要的意义,为了让其成为具
Web 3.0时代中的电子商务正经历着深刻的转型和升级:新的商业模式--社交电商的横空出世预示着消费者的行为将被赋予更多的经济价值,尤以社交行为最具代表性。社交媒体与电子商务的深度融合也将更受经营者们追捧。但社交电商这一经济“新爆点”在茁壮成长之际也暴露了许多新问题、面临许多新风险,因此探讨如何监管社交电商,特别是如何进行法律监管显得尤为重要。本文以“法律监管社交电商”为主题,首先讨论了社交电商的
学位
教育部组织编写的新版初中道德与法治教材,全面体现初中课标的要求,强调学科核心素养的培育,注重德育回归生活课程理念的落实,教材中“拓展空间”栏目的设置和有效运用是达成这一课程目标的重要渠道,也是初中创新性教学探究的一个重要尝试。“拓展空间”栏目成功地架起了教材理论知识与学生生活现实之间的桥梁,使教学由课堂延伸到更广阔的现实生活领域,对落实学生学科核心素养、提高教学实效、发挥教材育人功能、达成教学目标
学位
随着时代的发展,党和人民群众对于基层服务型政府的建设提出了更高的要求。乡镇公务员绩效考核能够提升乡镇公务员队伍的整体素质,进一步推动乡镇政府提供优质的公共服务,满足人民群众日益增长的服务需求。建立一套科学、合理的乡镇公务员绩效考核体系有利于激发公务员的工作积极性,提高乡镇政府的管理效率,推动农村经济社会发展。然而乡镇公务员工作的特殊性和复杂性给乡镇公务员绩效考核工作的开展增加了难度,因此完善乡镇公
在汽车、海洋装备、航空航天等诸多工程领域中,许多金属装备受腐蚀作用而服役寿命未能达到预期,目前对金属工件表面进行涂层防护是防止其受到侵蚀的重要手段之一。无机磷酸盐涂料可作为防腐材料、耐磨材料、耐火材料等,是一种水性无机涂料,对环境污染小。磷酸盐涂层因其附着力强、耐腐蚀、耐高温、无毒环保等优异的综合性能得到了研究者的关注。本文重点关注磷酸盐无机涂层是否能够兼具耐腐蚀性和耐磨性能的问题,以磷酸二氢铝为
2019年1-6月份,全国规模以上发电量33673亿千瓦时,其中火力发电24487亿千瓦时,占比72.7%,燃煤发电是火力发电的主要形式,占火力发电的88%,因此,煤炭依旧是我国的主要发电能源,这意味着电煤供应链的安全问题不仅是经济问题,更是关系到国民生活和工作的重大问题。然而,电煤供应链链条长、参与企业多、结构复杂、规模大等特点给电煤供应链安全运行带来了巨大的挑战。在电煤供应链中,上下游各个环节