主成分回归与分位数回归在两类数据中的应用研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:qnmdmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对实际数据的分析研究过程中,由于实际问题往往是多因素多变量的,因此常用到多元统计分析的方法。本文利用多元统计分析的主成分回归与分位数回归对两类数据进行分析研究,首先比较这两种方法的各自的特点,然后将二者结合应用,对数据进行更全面的分析。本文所选取的两类数据其自变量都有不同程度的多重共线性,主成分回归是一种常用的,解决自变量之间共线性问题的回归方法。分位数回归在不同的得到不同的回归方程,通过比较各分位点回归方程参数的显著性及大小变化,可得到不同分位点自变量对因变量的影响。与主成分回归相比,分位数回归对数据分析的更全面。中位数回归是分位数回归的特殊情况,对所选取的两类数据进行中位数回归,将其结果与主成分回归的结果对比分析,发现模型之间的共线性会使中位数回归方程偏离实际,不具备参考价值。考虑到主成分回归中的主成分之间是线性无关的,本文又对主成分下的分位数回归进行了研究。对主成分进行分位数回归,不仅克服了自变量之间多重共线性对回归方程的影响,同时也减少了变量的个数,简化了回归方程。主成分下的分位数回归能得到,不同分位点各主成分与因变量的相关系数,再结合各主成分对自变量信息的代表性,可分析出不同分位点部分自变量对因变量的影响情况。但是主成分是自变量的线性类合,对自变量信息的代表性有限,因此,这样的分析结果会出现误差。本文又对各自变量分别进行分位数回归,这样避免了变量之间的共线性对结果的影响,同时得到不同分位点的各自变量与因变量的回归系数及其显著性变化。再结合主成分下的分位数回归的分析结果,可对模型不同分位点的因变量和自变量之间的关系做出判断。因此对于自变量具有多重共线性的模型,主成分下的分位数回归与对自变量分别进行的分位数回归都有各自的优缺点,将二者结合,可对模型的解释更客观合理,且对实际运用更具有指导意义。
其他文献
回顾了景观规划的发展历程,并依据城市森林生态服务功能的内涵,指出当前国内外景观规划中存在的缺陷与不足。旨在通过对二者关系的分析,解读景观生态学理论引入规划中的功能
自水解制备低聚木糖是生物质资源利用的一个重要途径,目前受到了广泛的关注和研究。低聚木糖作为一种良好的益生元,其对人体健康的促进作用也越来越被人们所认知。然而,生物
在文化主宰世界发展的时代背景下,人们对武术更深层的教育价值以及深厚的文化底蕴的关注已然达到的一个空前的高度,武术也不再仅仅是单纯的身体锻炼或技术学习,随之孕育并繁
商业银行信用风险管理贯穿于整个商业银行发展的历程之中。但是由于我国商业银行在进行信用风险管理方面起步较晚,再加上外部环境与制度上的原因,导致我国商业银行信用风险管
<正>近年来,随着深化放管服改革的不断深入,政务事项如何规范化开展服务成了各地攻坚的问题,作为深化改革的"最后一公里",基层窗口的"标准化"建设成了破题的关键。惠民县立足
采用1961—2016年春季(3—5月)内蒙古逐月降水资料,应用统计相关分析、REOF,对比分析等方法分析研究了内蒙古地区春季降水类型的气候特征以及海洋和大气环流特征。可以发现,
通过对GB/29692-2013方法一中流动相组成比例、流动相pH值、色谱柱规格三个色谱条件的研究,发现在满足药物色谱峰分离度>3.0的条件下,应用CAPCELLPAKC18(250mm&#215;4.6mm,5
[目的/意义]针对我国智库建设相对滞后的现象,提出构建智库成长的保障机制,拟为新型智库建设提供决策参考。[方法/过程]通过运用文献研读和理论推演等方法,分析了智库在现代
<正>工业化和现代化是经济社会发展的必然趋势,破解城乡二元结构难题,实现"三化"同步是农村改革的最终目标。农民创业是实现这一改革发展目标的重要途径,是实现农业发展方式
会议
2015年中央经济工作会议提出将“去产能”作为重要任务。在产能过剩问题中,我国煤炭供需形势严峻,产能过剩严重,制约了我国经济的转型发展。煤炭行业也是受宏观经济影响较大