基于对数范数约束的鲁棒稀疏非负矩阵分解

来源 :青岛大学 | 被引量 : 0次 | 上传用户:darling1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非负矩阵分解算法是一种常用的机器学习算法,它将原始数据分解为局部特征的纯加性组合,符合人类对于信息的认知方式。算法中的非负约束可以给分解后的矩阵带来稀疏的性质,使数据基于部分的表达更加明显。随着国内外学者对于非负矩阵分解算法研究的不断深入,算法的许多改进版本也相继被提出。但目前的非负矩阵分解算法还存在一些不足,例如:单一的非负约束无法控制分解后矩阵的稀疏性;l1和l2,1范数有时无法准确的进行稀疏性约束;传统的非负矩阵分解算法未考虑数据处于流形上的情形,对于非线性分布的数据无法很好地进行挖掘;在数据含大量噪声时,算法性能下降等。针对上述问题,本文主要进行了如下工作:(1)本文提出基于llog范数约束的稀疏非负矩阵分解算法,使用llog范数同时对基矩阵和系数矩阵进行约束,生成了更稀疏的解,揭示了更好的基于部分的表示。同时,本文在算法中加入图拉普拉斯约束项,处理数据线性不可分的问题,保持数据的局部间关系。(2)本文提出一种l2,log范数,并提出基于l2,log范数约束的鲁棒性非负矩阵分解算法。此算法为上述算法的扩展版本,旨在减少数据中的噪声对于算法性能的不利影响,它在模型中增加了噪声约束项,使用l2,log范数来限制噪声矩阵的列稀疏性。本文给出了l2,log范数相关阈值优化问题的解,即l2,log范数收缩算子。此收缩算子可以保证因子矩阵在每次迭代时是非负的,因而保证了算法分解的非负性。(3)为了实现算法的最优化求解,本文设计了上述两种算法的乘法更新规则,并提供了完整的理论证明,从而证明了更新规则的非负性和收敛性。(4)本文在10种公开数据集上进行了聚类实验。为了验证模型在含大量噪声的数据中的聚类性能,本文在原始数据集上分别以随机损坏像素点、产生伽马噪声和产生高斯噪声的方式加入噪声,并进行同样的聚类实验。实验结果从实际应用的角度证实了本文方法在聚类和数据表示方面是有效的。关于收敛性分析的实验从迭代次数和迭代时间两方面验证了算法的收敛性,证明了本文算法的可行性。同时,基矩阵稀疏度的比较和对于llog范数的消融实验都验证了本文所提的llog范数约束可以获得相比l1范数约束下更为稀疏的解。
其他文献
随着互联网的快速发展和全球化进程的不断推进,语言服务市场的需求快速增长,语言服务形式日趋多样,语言服务已经成为一个特定的产业领域,语言产业研究也受到越来越多学者关注,研究内容不仅局限于语言领域本身,而是涵盖多学科、多领域,成为兼具理论与实践意义的综合性研究。本次翻译实践报告选用的案本素材为《布鲁姆斯伯里语言产业研究手册》(The Bloomsbury Companion to Language I
学位
本次翻译实践报告选取的文本是由美国专栏作家迈克尔·沃尔夫(Michael Wolff)所撰写的人物传记《滑坡:特朗普总统任期的最后时光》(Landslide:The Final Days of the Trump Presidency)的第一章。该章介绍了美国总统大选前唐纳德·特朗普(Donald Trump)总统及其团队为其继续连任所做的种种努力,其中包括聘请专业人士帮助分析如何获得更多选票、模
学位
本文选用美国NASA“毅力号”探测器着陆火星直播为素材,在吉尔的认知负荷理论指导下,从听辨、记忆、表达输出三个方面分析直播同传的难点并总结相关技巧,分析了直播同传和一般的会议同传有很多不同之处,从而为译员自身积累经验,为同类直播同传提供借鉴。通过案例分析,笔者总结了节目直播的同传在听、记、说三方面的难点与技巧。在听辨理解方面,难点包括发言人语速过快、非主观因素(如设备)造成的漏听,以及听不懂的情况
学位
新时代下随着我国经济的发展,城市规模的不断扩大,城市中常住人口与流动人口也伴随增长,从而促进了我国的城市化进程,此过程中逐渐涌现出各种复杂的社会矛盾和棘手问题。提升城市居民的获得感和幸福感,让城市生活更加安全、美好、精致,最根本的做法就是进行城市精细化治理。城市精细化治理本着从“全面、精致、开放、科学、法治”的角度出发,成为提高城市质量、打造城市名片、改善城市生活环境的一个有效途径,也是促进国家治
学位
针对人口的过快增长,我国实行了严格的计划生育政策,在此过程中,诸多独生子女家庭产生。同时,由于独生子女亡故而产生的失独老人问题也引起社会的广泛关注。失独老人是一类特殊的群体,他们所面临的较为严重的心理问题已成为影响社会和谐发展的重要风险因素之一,因此对这一问题进行深入研究对于维护社会稳定,体现人文关怀具有重要意义。本研究主要探讨了叙事治疗方法在失独老人心理重塑中应用的过程及效果。在Q市5家养老机构
学位
班级是学校教育的基本单位,是学生直接组建并成长发展的天地。班主任是班级的组织者和领导者,传统的班级管理以班主任为中心虽然存在优点,但是随着素质教育时代的推进,以班主任为主的班级管理却逐渐失去了管理的活性。寄宿制学校不同于公立学校,学生们在校时间较长,且学习和生活都在学校,这对于学生自主管理的要求更大,班级管理应当以学生为主体,实行科学的自主管理模式,促进学生成长发展。本文在对青岛市C小学小学生参与
学位
近年来,随着社会的发展进步,传统的单机器模式已经不能满足复杂生产实践的需要,学者们开始研究高效、低成本、可扩展性的集群系统,集群相关技术的研究成为前沿研究方向.本文根据Kurzhanski提出的虚拟椭球,从理论基础和数值算法两个方面,考察了具有扰动与移动目标的无人集群控制问题.为了实现无人集群的稳定运动需要考虑到扰动环境,针对扰动因素本文考察具有有界扰动和具有随机扰动的两类无人集群控制问题.基于椭
学位
民主监督是全过程人民民主的重要环节,也是当代中国政治哲学重要理论和实践命题。新时代民主监督研究有着绵延不断的理论承续,呈现出丰富多样的话语范式,在思维方式、价值观念和发展方向上深刻地影响着全过程人民民主的实践推进,为中国特色社会主义民主政治建设提供了坚实支撑。民主监督的理论演变映射出中西方思维与文化差异,呼应了人类政治实践的发展与成熟,影响着现代文明秩序的维护与建构。立足历史唯物主义基本立场,揭示
期刊
自2003年开始,世界银行每年都测评全球100多个区域或地区的营商环境,发布《营商环境报告》。世界各国对此都十分重视,并纷纷采取措施来优化营商环境。我国也把优化营商环境工作摆在了前所未有的高度。当前,我国经济已由高速发展转向高质量发展,正处于发展模式转换、结构优化的关键阶段,优化营商环境已经成为推动我国治理体系和治理能力现代化的一个重要途径。县级市作为优化营商环境的具体实施单位,处在优化营商环境建
学位
聚四氟乙烯(PTFE)又称特氟隆,因具有优异的耐高低温性能、突出的不沾性与润滑性、良好的绝缘性能以及优异的化学稳定性、阻燃性、耐老化性等,而广泛应用于环保、过滤、纺织、石油、医疗、通信、建筑等多个领域。现有的PTFE产品主要有薄膜、短纤、短纤无纺布、短纤纱、长丝、长丝合股线和长丝编织线等多种产品形式,但尚未见PTFE膜裂长纤纱这一品类。通过市场调研和对企业现有生产技术分析发现,现有的PTFE短纤纱
学位