【摘 要】
:
变量选择在统计建模过程中是极其重要的问题,但传统的变量选择方法却存在一些不足。尤其是当p相对于n较大、某些变量之间的相关性又较强时,有些对预测影响较小、甚至没有影响
论文部分内容阅读
变量选择在统计建模过程中是极其重要的问题,但传统的变量选择方法却存在一些不足。尤其是当p相对于n较大、某些变量之间的相关性又较强时,有些对预测影响较小、甚至没有影响的变量也被选入了多元回归方程中,从而使估计和预测的精确度下降了。针对这一问题,Daye and Jeng (2009)提出了Weighted fusion[1]变量选择方法,该方法很好的克服了传统方法的一些不足。在本论文中,我们利用Daye and Jeng (2009)提出的Weighted fusion变量选择方法,对数据进行变量选择。计算加权fusion的估计和预测变量之间的样本相关系数,利用加权fusion惩罚函数,得到L2范数下fused lasso估计。通过对“森林中蝙蝠活动”这个数据做分析,进行变量选取。首先分析研究了预测变量之间的样本相关系数,得到了很多相关性很强的变量,因此,不能用传统的方法去选择变量。接下来展现了响应变量与预测变量之间的散点图,分析散点图,得到了响应变量与预测变量之间的直观联系。再利用加权fusion,按变量的重要性将预测变量进行排序。这样,就可以为我们计算变量选取的个数提供方便。最后,使用AIC、BIC准则选择变量。实际数据和实例表明,加权fusion可以有效的进行变量选择,提高预测的精度。
其他文献
本文研究了具有饱和型发生率和Holling II、HollingⅢ以及广义功能反应型函数的三种生态流行病模型.它们分别安排在文章中的第二、第三以及第四部分. 文章通过对三种不同
在本文中,我们考虑一个由美式看跌期权定价问题产生的变分不等式,它的原生资产价格服从Hurst参数H∈(0,1)的分数次布朗运动.首先,我们证明了解的存在与唯一性.接着,我们推出了永久美
对角占优M矩阵,严格双对角占优矩阵和广义严格双对角占优矩阵是科学计算中重要的特殊矩阵类.本文主要针对这三类特殊矩阵,采用预处理的办法,给出||A-1||∞的上界估计,得到的结果
一个图G=(V,E)的能量指的是其特征多项式的特征值的绝对值之和.即:E(G)=∑ni=1|λi|.本论文是在前人的基础上,更进一步的对两类特殊二部图能量进行了研究.主要内容包括:
第一章介
据中国互联网络信息中心发布的《2013年中国青少年上网行为调查报告》显示,青少年互联网普及率持续攀升,并向低龄群体渗透加大。截至2013年12月底,中国青少年网民规模已达2.5
2003 年,代数攻击攻破了许多曾被认为安全的流密码体制。代数攻击对流密码构成了极大威胁。如何抵抗代数攻击是密码学者们关注的焦点之一。目前,这个问题尚未完全解决。2004 年
本文综合运用Navier-Stokes方程以及调和映照热流的相关研究技巧,讨论了初始密度po≥ 0的N(N≥2)维可压缩液晶模型的球对称问题.对于任意的γ>1,得到了有界或无界的环形区域上的
我们每个人的能力是有限的,许多问题不可能一朝一夕获得解决。因此,我们必须有规划并且一步一步行动,逐渐朝目的地逼近。
The capacity of each of us is limited and many
假设K是特征零的域,δ是K中的元素.本文主要研究域k上Brauer代数的胞腔模(Cell模)的合成因子及其分解重数.我们的结果说明代数的胞腔模(Cell模)是重数自由的.