通过交叉验证准则选择线性模型

来源 :东南大学 | 被引量 : 0次 | 上传用户:whp71518255
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多元线性回归模型(变量)选择的研究中,形成了许多有效的方法,如C_p准则,Akaike(1974)的信息准则(AIC),Bayes信息准则(BIC),φ准则,交叉验证准则;因为它们所选择的惩罚函数是固定的,当然,使用固定的惩罚函数可能在某一情况下表现很好,但在其他情况下表现不一定会好;所以惩罚函数的选择直接到模型选择准则的表现好坏;从而需要找到一个基于数据的惩罚函数,这样模型选择准则就会有很好的表现,Rao and Wu(1989)首次提出了基于数据的惩罚函数并应用到多元线性回归的模型选择问题,本文是基于Rao and Wu(1989)的论文并对其方法作了些改进,考虑建立在交叉验证准则基础上线性回归模型的选择问题。我们对原来的交叉验证准则进行改进,通过增加惩罚函数来解决交叉验证过程中模型过度拟合问题,从而提出一个新的模型选择准则。在一定的假设条件下,新准则确定的模型具有强相合性并且在样本容量充分大时能得到最小真实模型。从Monte Carlo模拟实验可以看出,我们提出的基于数据的惩罚函数的模型选择准则比选用固定的惩罚函数的模型选择准则效果更好,并且在小样本时表现很好。
其他文献
2000年,大众媒体成为普京竞选总统有力的舆论工具,对普京总统的当选起了很大作用。执政之后,普京一方面肯定“新闻自由”,另一方面反对大众媒体的放任自流。普京通过打击别列佐夫
本文选取《红楼梦》和《激流三部曲》这两部以"家族没落"为题材的经典小说,探究作品中新旧两个世界的建构与解构的过程中女性形象的存在价值,并进一步分析其中折射出的女性观
【正】 1987年夏为组队考察临夏州作准备,根据室内资料,写出本文初稿。同年7月27日至8月5日参加甘肃省文史研究馆与临夏州志办、档案馆、州政协及兰州大学、西北师院有关专业
试验设置全素(control)、缺氮(-N)、缺磷(-P)、缺钾(-K)、缺钙(-Ca)、缺镁(-Mg)、缺硫(-S)7个处理,对广州红花油茶幼苗进行缺素施肥试验,通过测定苗高、地径、叶面积以及叶周长等指标,探究
目的了解传染病医院护理人员职业暴露及防护现状,探讨传染病医院护理人员职业暴露的防护措施。方法根据发生职业暴露的相关因素,采用培训、现场指导等干预措施,制定传染病医
计算机的出现,使得信息的存储空间扩大,满足了人们对数据的存储的需求。然而在计算机存储数据时,也可能因为某些因素的影响,而使得数据出现丢失的现象,这就问题的出现,使得计
新辅助治疗可使原发肿瘤或转移病灶缩小,降低肿瘤分期,已被认为是进展期结直肠癌(ACRC)的主要治疗方式。但由于肠道为空腔脏器,原发病灶准确测量困难,新辅助治疗后的疗效评估
随着现代科学技术的不断发展,我国的数字水印技术也得到了相当大的进步和发展,在现阶段当中,为了充分的对数字水印的使用范围进行扩大,需要在人类视觉的系统基础上进行离散小
目的调查和分析老年人睡眠状况.方法对在我院进行体格检查的离退休老年人发出问卷1 000份,共收回有效问卷815份,占81.5%.结果只有21.6%的人认为自己无失眠情况,而78.4%的人自
基于第六次乡镇级人口普查数据,利用GIS技术展示陕西省人口信息的空间分异格局,通过计算Moran’s I指数、信息熵、分异指数、隔离指数等空间自相关和空间分异指标,结合地貌、