基于稀疏主成分分析的高维数据特征选择

来源 :福建质量管理 | 被引量 : 0次 | 上传用户:qimao1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的高速发展,带来了数据的海量存储,数据的维度也随之升高.数据维度的升高不仅会在非参数模型中遭遇“维数灾难”,还容易在拟合过程中造成过度拟合.因此降低数据维度,简化算法,提高模型的可解释度成为数据挖掘的一项重要工作.而稀疏主成分分析在主成分分析的基础上能够提升变量的可解释度,且具有降维和特征选择的双重意义.因此本文以德国某信贷数据为例,对基于稀疏主成分分析的高维特征进行了选择.结果证明稀疏主成分分析能够同时达到降维和变量选择的双重目的,在实际的建模数据集预处理的过程中有重大价值.
其他文献
多发性骨髓瘤为浆细胞增生的恶性肿瘤。到79年止国内见文献报导的共66例,近年来有所增多。我院自1965年以来共诊断多发性骨髓瘤5例,现报告如下,并就诊断中的一些问题作简要
本文报告48例老年无合并症的轻型原发性高血压病人(年龄60—84岁)。治疗前四周不用抗高血压药。分为两组。第Ⅰ组15人,单用氯压定治疗,开始0.05毫克,口服,日二次。每周根据
早期复极综合征(Early repolarization S-yndrome)是心电图较为常见的正常变异。在健康成年人中约占1~2.5%。临床上常误诊或疑诊为病理性改变,甚至给就诊者造成医源性疾患。
本文在Phillips和Magdlinos(2007)提出的非平稳AR(1)模型的基础上,讨论在未知时刻k0模型的自回归系数发生变化的结构变点问题。本文考虑模型yt=β1yt-1I{t≤k0}+β2yt-1I{t>k0}
当前制造业正面临着全球范围内的新一轮调整,其发展趋势是资源的全球分配和利用。经过多年的发展,中国制造业开始转换外包角色,由传统的接包商转换为发包商,但是基于全球价值链的
利兹综合医院心血管病研究部在最近的一篇论文中对于静脉内注射大剂量利尿剂治疗左心衰竭这一公认的疗法提出了疑问。Nelson医师及其同事们说,急性心力衰竭的血液动力学情况
近年来,心脏生理学,特别是控制心脏作工和心肌力学的知识,有了迅速的发展。这项研究在临床上就是使用主要影响外周循环的血管扩张剂治疗各种病因所致的急慢性充血性心力衰竭
望江县紧扣“加速发展桥港经济、奋力推进望江崛起”主题,以“四个突出”扎实推进创先争优活动,取得了明显成效。突出服务科学发展这个大局。将开展创先争优活动与服务经济社
历史对学生健全的发展起着非常重要的作用。因此,教师要采用多样化的活动,激发学生的学习欲望,从而为高效历史课堂的实现打下坚实的基础。 History plays a very important
作者对163例甲状腺毒症并发房颤患者平均观察34个月。甲状腺功能正常后,其中101例自发转为窦性心律,另外62例仍持续房颤。自发转为窦律者在甲功正常之前房颤 The author of