一种均衡的RHS交叉验证

来源 :南京大学学报(自然科学) | 被引量 : 0次 | 上传用户:jhuihui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在统计机器学习中,交叉验证方法利用对一个数据集的多次切分,来构造多次重复实验,并以此估计机器学习模型的预测误差.然而交叉验证估计的稳定性与数据集的切分方式有着密切的关系.也就是说,不同的切分方式会导致训练集中所含共同样本的个数不同,当共同样本较多时,交叉验证估计具有较大的方差.为此构造了一种均衡的RHS(Repeated Half-sampling)交叉验证,使得训练集所含共同样本的个数的总和最小,并且任意两个切分之间的共同样本个数保持均衡,进而降低泛化误差估计的方差,进而有效地提高泛化误差估计的稳定性.
其他文献
针对移动通信环境下的路径分布问题 ,利用二项分布和离散参数马尔科夫过程分别建立了路径的分布模型 ,并得出两种模型在接收最大路径数趋于无穷大时均收敛于泊松模型的结论 ,提出了一种模型修正方法
多脉冲脉位键控调制 (PPK)的编码和译码是实现 PPK调制体制最基本的课题 ,介绍了PPK编、译码定义和对应的编、译码方式。给出了脉冲位置为 m的 k个脉冲 PPK调制的编、译码通用数学表达式。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
速度分辨力是线性调频信号(LFM)的关键特性之一,其和LFM参数的现有定量关系是在窄带近似条件下基于窄带模糊函数的分析结果.在宽带声纳或者超宽带雷达应用中,窄带近似条件往往
作者通过对国内外文献分析,以及本实验室研究结果,尝试阐述我国结核病疫苗研究策略。文章阐述了结核病初免疫苗研究,并对BCG接种后加强免疫用疫苗进行分析,同时还对结核杆菌潜伏
为了加快钢渣-粉煤灰复合掺和料的开发和运用,通过考察钢渣-粉煤灰掺入水泥-聚羧酸高效减水剂体系后,浆体的初始坍落扩展度和经时损失,试验研究不同掺量的钢渣和粉煤灰对聚羧
论述了遥测参数仿真与判决系统的模块化设计思想,采用面向对象的设计方法,各功能模块尽量独立,使得软件的修改和维护变得快捷和方便,大大降低了维护周期和成本。遥测参数仿真为测
一直以来,在我国经济学界都将经济的强大归因于大公司的作用,然而一场牵动全球经济的亚洲金融危机引起了很多学者的反思,他们开始将关注点转向了中小企业,2016年随着大众创新
<正> 前言宜兴紫砂由于其得天独厚的泥质和它具有其它瓷器无法比拟的优点而驰名中外,因此人们对紫砂陶的原料—紫砂泥产生了浓厚的兴趣,也引起了广大地质工作者的重视。本文
受文de Laubenfels(1997,Isreal Journal of Mathematics,98:189—207)的启发,引进空间形(A,k)和H(A,ω),它们分别是使得该二阶抽象Cauchy问题有在[0,∞)一致连续且O((1+t)^k)有界和O(e^ωt)有界的