基于稀疏回归的无监督特征选择

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cicf1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网及物联网技术的快速发展,在科学研究以及日常生活等方面产生的数据都是成千上万甚至更多维的高维数据。其中,高维特征的数据中含有重要的特征、冗余的特征、不重要的特征甚至是噪声特征。数据分析的目的是从大量数据中获取有意义的数据,从而完成相应的聚类或分类等任务。然而,数据的爆发式增长给传统的数据分析方法带来了时间和空间上的更高要求。因此,需要采用降维方法对高维数据进行预处理,得到低维空间下的纯净数据。近年来,许多基于稀疏回归的特征选择算法被提出。然而,这些特征选择算法仍然存在一些局限性,比如对嵌入维度敏感,稀疏性不足,对数据信息利用不足等。因此,本文针对这些方面进行了一些改进,以克服现有算法模型的不足。本文的贡献主要包括如下几点:(1)提出一种基于非负矩阵分解和正则化稀疏回归的无监督特征选择算法(JMFSR)。JMFSR算法旨在找到更合适的伪类标索引矩阵。首先,该算法采用带有正交约束的非负矩阵分解学习基于部分的数据表示。然后,通过正则化稀疏回归模型学习一个特征权重矩阵。另外,该算法引入了l2,1范数同时对稀疏回归项和特征权重矩阵施加约束,从而能够有效的选择具有代表性的特征子集。(2)提出一种基于自表示稀疏回归和局部相似性保护的无监督特征选择算法(UFSRL)。UFSRL算法旨在克服一般特征选择算法对嵌入维度敏感和稀疏性不足的问题。首先,该算法是对原始数据本身进行稀疏重构,而不是拟合低维嵌入。其次,该算法采用了流形学习方法保护数据的局部相似性。另外,该算法采用了l2,1/2矩阵范数对系数矩阵进行约束以保证系数矩阵的行稀疏性,使得UFSRL模型稀疏性和对噪声的鲁棒性更好。(3)提出一种基于自表示和非负矩阵分解的混合图正则化特征选择算法(SRMFMR)。SRMFMR算法旨在解决一般特征选择算法对数据信息利用不足的问题。首先,该算法在自表示回归模型基础上对自表示矩阵进行非负性分解,得到一个新的特征选择矩阵和一个系数矩阵。其次,SRMFMR采用一种混合图模型,即分别在样本空间构建全局图,在特征空间构建局部图,这样能够使模型有效保护数据空间的全局信息和特征空间的近邻相似信息。
其他文献
目的 探讨不同人群血清中人SARS冠状病毒抗体和动物SARS样冠状病毒抗体所表达的意义及其之间关系。方法 应用人SARS冠状病毒和动物SARS样冠状病毒抗原片进行间接免疫荧光 (
【正】一、剧情阐述澎湖岛上的风柜,阿清、阿荣、彭仔、土豆四个年轻人高中没有毕业,整日无所事事,又不明确未来的方向。他们精力旺盛而且身强体壮。每天空闲中总是玩乐:赌钱
从汽车前部偏置碰撞动量分析入手提出碰撞前后汽车运动状态间的关系,得出结论:汽车碰撞时95%以上的能量均由汽车车体变形所吸收;碰撞后汽车的运动状态(即汽车运动的速度及角速度)与汽
目的:观察护理干预对乡镇养老院老年人生活质量的作用。方法:入住某乡镇养老院生活的老年人54例,进行针对性心理疏导及ADL训练等护理干预。并通过自身对照法于干预前后采用抑郁
基坑工程长约190 m,宽约98-195 m,呈"L"形,基底标高不一(主体深10.4 m,部分地段深6.48 m),东部中段存在下沉绿地(深5.88 m),整个基坑分2期施工;采用"φ600排桩+桩顶土钉墙"进行基坑支
目的:概述银杏叶提取物近几年的临床研究结果.方法:查阅近期文献资料,总结银杏叶提取物的药理作用和特性.结果:银杏叶制剂可用于治疗心脑血管疾病、老年性痴呆、突发性耳聋与
<正>今年2月,省档案局(馆)在全省档案系统开展了&#39;重新认识档案工作&#39;大讨论活动。为配合活动的开展,《浙江档案》专门开辟了&#39;大讨论&#39;栏目,用以刊登各地有关大
目的:观察固本化斑汤方对脑梗死恢复期脾肾两亏、痰瘀阻络型干预效应,评价临床疗效。方法:观察和比较两组治疗前后的日常生活能力量表(ADL)评分,检测治疗前后血浆同型半胱氨酸(HCY)、
研究证实,今年暴发的非典型性肺炎,病原是一种源自动物的冠状病毒变异株.因此,加强各种动物冠状病毒病的控制诊断、监测,是进一步做好重大动物疫病防治工作的一项紧迫而重要
两宋赣文化辉煌灿烂 ,其成因也错综复杂。本文试对两宋赣文化繁荣的原因作些宏观分析 ,并从科举制度与赣文化发展入手 ,从科举制度与两宋江西文化的大普及 ,学校教育的发达 ,