高维多重共线性数据的变量选择问题

来源 :山东大学 | 被引量 : 0次 | 上传用户:nwwwdff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变量降维问题一直在统计研究学习以及实际应用领域起到至关重要的作用,对于存在多重共线性问题的数据,一般的最小二乘方法基本失效。本文介绍了一般的共线性变量选择方法包括惩罚的似然方法,如岭估计,桥估计和一些降维方法,如主成分回归,偏最小二乘回归以及高维数据降维方法Elastic Net方法。本文从新的角度来解释岭回归的惩罚作用,借助于这个方法我们为Elastic Net方法l2惩罚部分增加了权重,本文也提供了两种选择权重的方法,在保证了变量选择的有效性下,通过对实际数据以及模型的模拟验证了其有效地减小了预测误差。
其他文献
人类基因组计划的顺利实行与测序技术的急速发展,造成了生物序列数量的急剧增多。面对数以万计的数据,如何发现潜藏在生物数据中的生物信息,分析这些生物序列间的关系,是分子生物
1前言rn传统的电信传输网是以时分复用(TDM)为技术基础的,话音和数据流量几乎都是通过TDM电路交换网络加以传送,但随着Internet的飞速发展,IP技术的主导地位日渐明晰,未来网
冲绳是个独具魅力的海滨度假胜地,蓝天碧海和独特的文化风情让人流连忘返,亚热带的海洋气候带给了冲绳终年的阳光普照,海天一色,时尚轻巧的三星NX mini在这里充分感受到了冲
模糊统计分析是近年来统计学研究的课题之一,很多学者对模糊回归分析的研究做出了不少成果。但由于模糊数据的复杂性,对多元线性模糊回归模型和非线性模糊回归模型的研究还相对
在代数领域中,保持映射通常指的是两个代数系统之间把代数系统中算子的某种特征或代数系统自身的某种特征作为不变量的映射。保持问题则是刻画这种映射结构的问题。关于保持
本文主要研究学生的学习态度对于考试成绩的影响.在模型中,每个考生有一标签g∈{0,1}∶1,0二值分别表示该生学习态度端正和不端正.假定考生v的标签gv是未知的.主要目的之一就
自然科学与工程技术中许多非线性问题的不断出现使得Sobolev空间表现出了其应用范围的局限性,例如对一类具有变指数增长性条件的非线性问题的研究。具有变指数增长性条件的非
Plenty of dams in China are in danger while there are few effective methods for underwater dam inspections of hidden problems such as conduits,cracks and inanit
矩阵理论是代数学科的一个重要分支,也是一种基本的数学工具,在数学学科以及其他的很多学科领域内都有重要的应用。目前,矩阵理论已经广泛的应用在无线通信,金融统计,系统工
双曲型守恒律方程数值解法既是偏微分方程数值解研究的重点,也是难点。通常我们只能得到该方程的弱解,所以必须对其加以限制,才可能获得符合物理背景的解。与物理背景紧密联