基于稀疏和信息论的无监督特征学习算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yuandt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据采集技术的不断进步,原始数据的维度变的越来越高。更高维度的数据能获得更多有用信息的同时也引入很多冗余、增加算法的计算复杂度。为了适应日益增长的数据维度和有效处理样本数据,减少数据的冗余,如何从高维度数据中有效的学习到低维度特征是现在数据处理及大数据中迫切需要解决的问题。随着数据采集方式越来越多样化,数据样本的数量越来越多,若对训练样本进行人工标记需要消耗大量的时间成本和人力成本。因此,无监督的数据降维特征学习方法越来越受人们所重视。本文以无监督特征学习算法为研究课题,重点研究了基于稀疏和信息论的无监督特征学习算法,所包含的两大块研究内容如下:第一,本文研究了在基于稀疏建模的无监督特征选择方法的建模及算法设计。首先,特征选择问题被建模成子空间学习模型,并通过在模型中加入稀疏约束来选择出更有用的特征。这部分提出了三种基于子空间学习的特征选择方法:1)为了更有效地选择出特征且消除负贡献对问题的影响,提出了一种基于非负子空间学习模型。为了更有效地挖掘数据内部信息,本文将自适应稀疏性框架ISD加入到子空间学习的过程中,提出了一种非负自适应稀疏约束的子空间学习模型;2)为了充分应用数据内部的信息,本文进一步考虑将数据的局部结构加入到子空间学习的过程中,提出了一种全局及局部结构保持的子空间学习模型;3)在无监督背景下,为了加入判别信息,本文将样本聚类信息作为一种判别信息加入到子空间学习的过程中,提出了一种判别子空间学习方法。第二,本文研究了基于信息论学习的鲁棒无监督特征学习方法。在特征学习中若数据存在局外点,基于Frobenius范数设计的目标函数会受到局外点的严重影响。本文采用信息论学习中最大相关熵准则对目标函数进行建模,提出了两种基于最大相关熵准则的鲁棒特征学习模型:1)为了提高无监督特征选择模型对于局外点的鲁棒性,本文采用最大相关熵准则与局部结构保持子空间学习相结合对无监督特征选择模型进行建模,并提出了基于最大相关熵准则的鲁棒无监督特征选择模型;2)为了提高稀疏主成分分析(SPCA)关于局外点的鲁棒性,本文采用最大相关熵准则对SPCA进行建模。同时为了更加充分的利用样本内部的信息,于是在SPCA模型中加入多超图学习正则项,使模型能够利用样本内部的流形信息,并提出一种基于最大相关熵准则和高阶流形约束的稀疏主成分分析模型。
其他文献
在初中教材中,对二次函数作了较详细的研究,由于初中学生基础薄弱,又受其接受能力的限制,这部份内容的学习多是机械的,很难从本质上加以理解。进入高中以后,尤其是高三复习阶
后劲生的情绪变化直接关系着后劲生们的学习兴趣、学习效率,也关系到学校的教育教学管理。本文就如何引导学生自我管理情绪的意义和策略进行了探讨。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
批判性思维教学和传统教育中的'接受式'思维相反,主要强调学生要在阅读过程中不断与作者对话、交流、沟通,来积极构建知识,形成自己的观点和看法。批判性思维旨在培
终身教育体系是以现代大教育观看教育的形态和体制,是一种思想理念,它强调教育的终身性、系统性、连续性和整体性。终身教育体系和学习型社会的构建已成为社会发展和个人自我
空间飞行过程中,宇航人员暴露于失重环境下,将导致骨骼系统发生结构和功能的变化,主要表现为骨量丢失,骨骼脱矿,骨力学性能下降,出现负钙平衡。这种失重导致的骨骼系统变化,在重力生
目的 :建立金银花的HPLC指纹图谱 ,对 4个产地金银花中所含的组分进行综合评价并测定其绿原酸含量 ,为金银花药材的质量鉴定提供依据。方法 :采用HPLC方法将获得的色谱指纹图
从1885年VonRecklinghausen首次提出并命名子宫内膜异位症[1](内异症)至今,恰是1个世纪零10年,而且,内异症作为“现代病”,已成为生育年龄妇女的多发病、常见病。最早的研究
旧钢管桩在使用多年后以及新钢管桩在施工过程中,防腐层的腐蚀、残损不可避免,如何进行维修是个大难题,迄今成功的工程案例不多。就此提出一种新的解决方案,论述了防腐材料选
信息技术以及网络技术等新媒体技术的发展,迎来了大数据时代,大数据已经成为高等院校思想政治教育的载体。对于高校学生而言,其能够快速接受新兴事物,思想活跃,深受大数据时