面向高维回归的组块3×2交叉验证调节参数选择

来源 :山西大学 | 被引量 : 2次 | 上传用户:zhouqjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物信息,图像处理,金融管理等实际应用领域中频繁地遇到高维数据,但是即使是在最简单的线性回归模型下传统的低维数据处理方法面对这样的数据时都变得束手无策,如何给出合适的高维数据处理方法是丞待解决的一个问题.处理高维数据一个最直接的想法就是通过降维把变量的维数降到样本个数范围内,然后用传统的方法进行处理.近年来,在高维回归的变量选择中,LASSO,SCAD,MCP等大量的正则化变量选择方法被提出,并得到了一些好的结果.然而,这样的方法都依赖于其中调节参数(正则化参数)的选择.因此,提供一个合适的调节参数选择方法,保证它能一致地识别出真模型是进行模型选择的关键.  在传统的统计学习中,基于交叉验证的方法被广泛地使用于调节参数的选择,然而在面对高维数据时它同样表现出了不好的性能.鉴于最近提出的组块3×2交叉验证在计算复杂度,模型选择和模型性能对照上的优势,我们考虑把它应用于高维回归中正则化变量选择方法的调节参数选择.  首先,本文证明了在一定条件下,基于组块3×2交叉验证方法选择的调节参数能保证高维回归中正则化变量选择方法能识别出真模型,即组块3×2交叉验证方法具有调节参数选择的一致性.接着,在基于线性回归和Logistic回归的模拟实验中,我们把本文方法和AIc准则,BIC准则,EBIC准则,HBIC准则,Hold-Out方法,5折交叉验证,10折交叉验证方法进行了对照.综合考虑各调节参数选择方法的错误的正例(False Positive),错误的负例(False Negative),预测误差以及计算复杂度,基于组块3×2交叉验证的方法是有优势的.最后,在真实的广告数据中,通过比较各方法的训练误差,测试误差及计算复杂度可以看出,组块3×2交叉验证方法具有比其它方法更好或可比的性能.
其他文献
中立型泛函微分方程在环境科学、生物学、物理学等领域都有重要的研究价值,已经引起了国内外众多学者的广泛兴趣,关于其周期解存在性的研究也取得一部分较好的成果.但带有脉冲
本文主要研究的是几何Hermite插值和肝脏CT图像分析算法。几何Hermite插值是一种比较有应用前景的插值方法。针对已有的研究工作很少考虑几何Hermite插值曲线的形状调整和光
如今,科学技术正处于多学科互相交叉和渗透的时代。特别是计算机科学与技术的迅速发展,从根本上改变了人类的生产与生活。同时,随着人类生存空间的扩大,人们对科学技术提出了
高中政治学科的内容相对来说比较抽象,如果对学生要求整齐划一,则会让很多学生失去学习的兴趣。实行分层教学就是为了让学生在现有水平上得到一定的发展,达到“分层是为了最
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
本论文主要研究时滞偏微分方程的数值方法,并进行理论分析。一般情况下,只有极少数时滞偏微分方程能够获得精确解的解析表达式。因此,研究数值方法不仅在理论方面,而且在应用方面
本文主要研究平面多项式微分系统原点与无穷远点的中心焦点的判定及可积性条件与极限环分支问题,全文由四章组成: 第一章对平面多项式微分系统的中心焦点的判定与极限环分支
高中语文的内容包罗万象、博大精深,它学之于生活,用之于生活。“文以载道,道在其中。”蕴含有优秀的传统思想和丰富的哲理是高中语文教材的一大特色。深刻理解课文的思想内
本文研究了刻划种群竞争的Lotka-Volterra方程和描述商品流通的Bass模型,以便从数学的角度来探索市场竞争和产品扩散过程中所表现出的动力学性质。本文研究的主要内容包括以下
教育是国家发展和社会进步的基石,而教师则承载着教育的重任.目前,由于现实存在的一些教育弊端和教育束缚,已经使得很多教师在对学生的教育上走入了误区,这一现状急需改变.