回归模型中变量选择的若干问题研究

来源 :兰州交通大学 | 被引量 : 4次 | 上传用户:stage7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多元线性回归建模中,自变量的选择至关重要,一般从预测的准确性和模型的可解释性两个方面进行约束自变量个数的选择.数目众多的自变量可以反映更多响应变量的信息,从而达到更高的预测准确性,然而太多的自变量将导致模型可解释性减弱,应用价值大打折扣;自变量的太少的话,不足以反映响应变量的信息,因而预测准确性显著降低.变量选择问题的研究中,大多是在普通最小二乘法的基础上,附加关于待估计参数的约束条件,也就是增加惩罚函数,转化为惩罚最小二乘法.由于约束条件的压缩作用,会使得部分待估计参数变为0,从而实现变量选择的目的.此类方法中的常用经典算法有LASSO算法、适应性LASSO算法、SCAD算法以及弹性网算法.本文考虑待估计参数受到随机因素的影响前提下,建立了新的惩罚函数及惩罚最小二乘估计方法,并对该方法进行评价,具体内容如下:首先,系统介绍了变量选择方法的发展过程、通过添加惩罚函数来实现变量选择的基本思想;详细分析了LASSO算法、适应性LASSO算法、SCAD算法以及弹性网算法的建立过程和各自的优缺点:由于LASSO算法中惩罚函数的特性,导致在变量选择时选取的自变量个数偏多,同时存在多重共线时LASSO算法效果很差,于是适应性LASSO算法在LASSO的基础上进行改进,使得估计所得系数更加稀疏,选择更少的自变量;SCAD算法效果更加更明显,不仅可以选择更少的自变量,同时所得估计量满足稀疏性、无偏性、连续性以及Oracle等一系列优良性质;弹性网方法是将LASSO与经典的岭回归法结合而建立的新的变量选择方法,该方法主要优势在于处理自变量中出现组效应时的情形.其次,考虑到Gamma分布和Weibull分布是两类重要的寿命分布类,具有广泛的应用,于是分别假定参数受到的随机影响因素服从Gamma分布和Weibull分布,建立了新的惩罚函数以及惩罚最小二乘估计方法.文中通过层次极大似然估计法构造新的惩罚函数,讨论了惩罚函数性质,给出了参数估计的方法并证明新建立的惩罚最小二乘量满足Oracle性质.最后,通过案例分析对新建立的变量选择方法进行评价.文中以均方误差和平均绝对误差作为评价指标,选取了以往文献中使用的经典案例进行分析,计算各评价指标,并和LASSO算法、适应性LASSO算法、SCAD算法以及弹性网算法计算的结果进行对比,我们发现,新建立的算法处理稀疏情形优势明显,均优于其他算法,而对于非稀疏情形,效果和适应性LASSO算法差异不大.
其他文献
2007年次贷危机爆发以来,美国等发达国家经济严重受创。为了振兴本国经济,美国政府于2009年底提出回归实体经济的经济政策,向出口推动型增长和制造业增长转变,致力于发展本国
在现代化人们发展中,生活质量得到显著提升,人们的精神文化需求也更为丰富.在各个市级文化馆发展中,为了做好群众文化工作,需要结合实际情况,按照实施要求,促使群众文化建设
粮食作为人类和社会的必需品,在千百年的历史长河中发挥着其独特的作用。农业补贴政策对确保本国农业在激烈的国际竞争中保持稳定发展起着至关重要的作用。保证了入世以来我国
介绍了以固态精白石蜡、氯气为主要原料,轻液蜡作稀释剂,采用引发剂光氯化法在无溶剂状态下制备氯化石蜡-70的新工艺.制备氯化石蜡-70过程中选用了过氧化物引发剂及光量子协
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
本文介绍了ERP管理思想,以及实施的方法,说明ERP是信息化建设、科研开发效率提高,提升产业竞争的必然途径.
期刊
随着中国市场经济地位和人们理财意识的提高,期货交易成为金融交易以及金融衍生品交易中的一个重要交易品种,期货市场的健康稳定发展也成为管理者和投资者研究的重点。不管是利
随着我国经济的不断发展,人民生活水平日益提升,在基本温饱问题得到解决之下,生活标准逐渐向着精神化层面发展,更加注重业余生活的享受.群众文化建设是精神文化建设的重要组
伴随着经济全球化和跨国公司的发展,对外直接投资与国际贸易的关系成为学者们热议的话题,究竟是互相替代还是互相促进,大家并没有形成一致意见。中国与东盟由于在地理位置上
旅游企业员工职业价值观培养有助于其思想道德建设,应与员工思想政治工作相结合.旅游企业要结合自身运营及发展特点,明确员工职业价值观内涵及该项工作的重要性,从多个方面对