主成分回归方法解决实际问题

来源 :数学学习与研究 | 被引量 : 0次 | 上传用户:wuweiguowwg32691819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】主成分回归是在确保丢失的有用信息最少的情况下,将多数原始变量转化成几个少数综合变量的一种降维回归方法.主成分回归能够很好地解决当样本数据存在一定程度的重复性并且在高维的空间中做分析时比较复杂的问题.它是一次对回归自变量重新选择的过程.
  【关键词】主成分回归;主成分分析;特征值;贡献率
  一、主成分回归的含义
  主成分回归是根据降维的思想通过线性变换,将样本中的多个指标组合成少数几个相互独立的并且能充分反映总体信息的指标,在不丢掉重要信息的条件下避开了变量间的共线性问题,进而分析.
  二、主成分回归的基本步骤
  首先利用主成分分析得到自变量的主成分矩阵和各个主成分累计方差的百分比;其次根据累计方差的百分比大于百分之八十的原则,得到新的回归方程,再从得到的新的主成分回归方程中选出最佳标准化主成分回归方程;最后对最佳标准化方程中新的自变量、因变量做最小二乘估计转换成一般线性回归方程.
  三、相关定义
  样本数据标准化后,其相关阵的特征值为λ1≥λ2≥…≥λp≥0,φ1,φ2,…,φp为对应的单位正交特征向量,Var(Ri)=λi,i=1,…,p且Var(R1)≥Var(R2)≥…≥Var(Rp).
  贡献率:λl∑pi=1λi为主成分Zl的贡献率.
  累计贡献率:∑qk=1λk∑mi=1λi为主成分Z1,Z2,…,Zq(q  均方误差:MSE()=E(-θ)T(-θ)=E‖-θ‖2,其中为θ的一个估计.
  四、实际应用
  对全国28个省市自治区经济发展基本情况八项指标做主成分分析,数据如下:
  求R的特征值及各特征值的贡献率
  如图1所示前三个特征值累计贡献率已达89.5%,则前3个主成分基本包含了全部指标具有的信息,所以我们取前三个特征值,并计算出相应的特征向量.
  α1=(0.4706410.4567080.424712-0.31944
  0.3127290.2508020.240481-0.26267)T
  α2=(0.1079950.2585120.2875360.400931
  -0.404310.498801-0.488680.167392)T
  α3=(0.192410.1098190.192410.397525
  0.24505-0.247770.3321790.723351)T
  即前三个主成分分别为:
  F1=0.470641X1 0.456708X2 0.424712X3-0.31944X4 0.312729X5 0.250802X6 0.240481X7-0.26267X8
  F2=0.107995X1 0.258512X2 0.287536X3 0.400931X4-0.40431X5 0.498801X6-0.48868X7 0.167392X8
  F3=0.19241X1 0.109819X2 0.19241X3 0.397525X4 0.24505X5-0.24777X6 0.332179X7 0.723351X8
  从第一个主成分表达式中可得知,前三项指标的系数比较大,起主要作用;我们可以把第一个主成分看成是前三项指标(GDP、居民消费水平、固定资本投资)反映经济发展状况的综合指标.
  從第二个主成分表达式中可得知,第四、五、六、七项指标系数比较大,且第六、七项指标的影响尤其大,则将其看成四、五、六、七项(职工平均工资、货物周转量、居民消费价格指数和商品零售价值指数)的综合指标.
  从第三个主成分表达式中可得知,第八项的指数影响最大,远超过对其他指标的影响,则可单独看成是工业总产值的影响.
  由以上分析可知,主成分回归的主要目的是要提取隐藏在矩阵X中的相关信息,然后用于预测变量Y的值.这种做法可以保证让我们只使用那些独立变量,从而达到改善预测模型质量的目的.由于主成分之间的互不相关的性质,因此它们携带的最初变量的信息是没有重复的,起到相互补充的作用.主成分回归在解决实际问题上是非常重要的.
  【参考文献】
  [1]王松桂.主成分的最优性与广义主成分估计类[J].应用概率统计,1985(01):27-34.
  [2]童恒庆.线性回归模型及计算[M].安徽教育出版社,1987.
  [3]王松桂等.主成分的最优性质[J].科学通报,1984(08):449.
  [4]杨维权.多元统计分析[M].北京:高等教育出版社,1989.
其他文献
【摘要】定积分是大学数学的重要组成部分,在许多问题的解决方法中是必不可少的.在几何学方面,定积分也有着广泛的应用.也正是因为这些应用,才推动了积分学的不断发展和完善.本文将在高等数学理论的基础上,介绍用定积分表示具体问题的方法——微元法.另外,定积分在初等数学中也有着良好的运用.本文研究了如何用定积分推导一些初等数学中的面积与体积公式的问题.  【关键词】定积分;面积;体积;几何应用  一、问题的
【摘要】基于对数学思维方法在艺术设计中应用的研究,首先,阐述数学思维方法基本内容.其次,分析数学思维方法与艺术设计之间的关系.最后,为使得数学思维方法能够在艺术设计中得到更好的应用,给出加强创新意识的培养、加强逆向思维教学、加强社会实践等措施.  【关键词】数学思维方法;艺术设计;逆向思维  【基金项目】海南省教育厅2019年度海南省高等学校教育教学改革研究项目“将美育理念融入《设计数学》课程教学
财政收入占地区生产总值(GDP)的比重,又称为财政依存度,它综合反映出政府与微观经济主体之间占有和支配社会资源的关系,反映政府调控经济运行的能力和影响社会资源配置的程度,也是
【摘要】陈述性知识是初中数学内容的核心.陈述性知识的意蕴指的是其所蕴含的理性内涵,包括陈述性知识的价值以及其中所体现的精神与情感.教师在教学的过程中通过追究身份、追溯历史、进行多种语言互译来挖掘陈述性知识的意蕴,可以推动学生分析问题、解决问题能力的发展,彰显数学丰富的人文价值、数学思想与精神,以及数学教学的育人价值.  【关键词】陈述性知识;意蕴;教学;育人价值  数学陈述性知识主要包括概念、法则
目的:探讨过氧化物酶体增殖体激活型受体γ(PPARγ)C161→T变异与冠心病的关系.方法:本研究采用病例-对照设计,筛选150例冠心病患者(冠心病组)及157例非冠心病患者(对照组)为
【摘要】以微信平台为主要代表的程序以其创新性、便捷性、实用性和高性价比成为在互联网技术日益发达的今天广受人们使用和好评的应用平台.鉴于其普及的范围较大,其中也包含着丰富的教学资源和多样化的教学功能,很适合运用到学生学习和教师的教学实践当中,实现很多之前难以想象的教学效果.本文即着眼于此,对微信混合式学习进行简要的介绍和分析,并深入分析其在高职数学教学过程中的优势,对微信混合式学习的实际应用提出科学
【摘要】让每名学生都全面发展,是时代赋予教育工作者的职责.教育工作者应落实课改精神,促进每名学生数学素养的提升,促进每名学生的健康成长和全面发展.然而,受多方面因素的影响,大多数班级中存在一些学困生.他们对知识和技能的掌握较为欠缺,需要教师不断深入引导.如何帮助学困生提高能力是初中教师十分关注的问题,也是需要解决的问题.笔者自身结合教学经验,分析了学困生的形成原因,着重探究初中数学教师应该如何做好
2006年,吴忠市按照“再造新优势、建设新吴忠”的战略目标,大力实施工业强市、商贸活市、科教兴市和新农村建设,全市经济保持了快、稳、好的发展态势和运行特点,实现地区生产总值
【摘要】数学是一门应用型学科,我们所学到的数学知识在生活中都能够得到一定程度的应用.因此,数学的实践性非常强.综合实践活动不仅能够加强学生对数学知识的掌握,还能够提升学生的综合素质.新课程标准规定:使学生懂得数学源于实践,又反过来作用于实践.要落实新课程标准的要求,教师就要组织开展综合实践活动.本文对综合实践活动的组织进行研究,为广大教师落实综合实践活动、提升实践活动的有效性提供参考.  【关键词
本文阐述了石油催化裂化烟气脱硫技术在国内外的发展,研究了目前正在使用的机种烟气脱硫技术。