基于组块3X2交叉验证分类学习算法的统计推断

来源 :山西大学 | 被引量 : 0次 | 上传用户:sashiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模型性能的评价是统计机器学习中的关键一步,它的好坏直接影响到机器学习的许多其它环节,泛化误差是最常用且最重要的模型性能评价标准,目前,泛化误差常用各种形式的交叉验证方法来估计。本文主要针对分类学习算法,从模型选择、方差分析、方差估计、假设检验等几个角度对新提出的组块3×2交叉验证方法进行了初步的研究,并取得了较好的结论。  组块3×2交叉验证的两大特点是折数低、对数据集进行均匀切分,因此,我们首先从折数的选择和数据集的切分方式对交叉验证方法进行了综合分析,结合已有的研究成果,我们判断组块3×2交叉验证在这两个方面很有优势。  我们将组块3×2交叉验证应用于分类学习算法的模型选择任务中,考虑到组块3×2交叉验证的特点,以及影响交叉验证模型选择方法性能的各种因素,我们断定组块3×2交叉验证要优于常用的5折、10折交叉验证。实验结果表明,特征取值连续时组块3×2交叉验证选到真模型的概率要一致的大于5折、10折交叉验证,且最多能大出近25个百分点。特征取值离散时虽有个别例外情况,但10折交叉验证比组块3×2交叉验证的优势并不明显,且后者与前者相比在计算复杂度方面有很大的优势,因此判断组块3×2交叉验证更适用于分类学习算法的模型选择任务。  当对比分类学习算法的性能时,需要从统计上对算法的泛化误差做显著性检验,而这需要有效的方差估计,因此,我们首先从理论上对组块3×2交叉验证的方差进行了分析,得到了其结构图,在此基础上给出了一个保守估计方法,并将其应用于泛化误差的假设检验实验中。实验结果表明,基于组块3×2交叉验证的t检验比其它常用的检验有更大的功效,即拥有更小的犯第一类错误的概率和更大的势。  自然语言处理中的许多任务都可看作是分类问题,其分类算法性能最常用的评价指标是准确率、召回率、F-测度值,只要这三个指标服从或近似服从正态分布,则上述关于泛化误差的研究结论都可应用于基于这三个指标的统计推断。已有研究结果表明,准确率和召回率服从贝塔分布,而贝塔分布参数值较大时近似服从正态分布。根据此结论及F-测度值与准确率和召回率的关系,我们通过模拟实验证明了F-测度值也近似服从正态分布。
其他文献
五千年悠久灿烂的中华文化,为人类文明进步做出了巨大贡献,这凝聚着中华民族的智慧,展现着中华民族的精神.让优秀传统文化走进校园,可以帮助少年儿童了解博大精深的中华文明,
针对物理复习课存在的较多难点,以物理专题复习课为例,开展有效实施方法探讨研究,认为教师采用多样化的教学行为,使学生手、眼、耳、脑并用,可帮助学生重新理解知识,提高思维
人脸识别是模式识别中的典型问题.从二十世纪九十年代开始,人脸识别问题引起了广泛的关注和讨论,大量的算法和系统在公司和大学的实验室里得到实现.人脸识别系统通常需要解决
1996年6月中华人民共和国对外贸易经济合作部正式赋予交通部水运科学研究所经营进出口业务权。我所进出口部仅用2个多月的时间办妥了工商局营业执照变更,北京海关注册备案,
论文由两部分组成:第一部分研究了应用科学中的一类重要的数学模型,即量子流体动力学模型.对一般压力-密度函数和非常数掺杂分布函数的情形,我们着重研究了一维初边值问题光
本文始终遵循二维问题“一维”化的思想,在一维分层基的基础上,提出了在改进的分层基下用双循环交替方向迭代法求解二维椭圆方程的边值问题. 分层基设Ω是平面多角形,Jh是Ω
新光集团淮北刘东煤矿是江苏省盐城市和安徽省淮北市缔结友好城市合作开发的第一个项目,由新光集团独资兴建,筹建于1992年12月,1998年12月建成投产。矿井井田面积18.6平方公
《普通高中数学课程标准》明确指出:“数学是人类文化的重要组成部分,数学素质已成为公民所必须具备的一种基本素质。”基于“课标”的理念,数学文化必须走进课堂,数学的思想
本文分别证明了椭圆型方程的基于外心对偶剖分的有限体积元法的L2误差估计,以及抛物型方程的基于外心对偶剖分的有限体积元格式的L2和H1误差估计。 有限体积元法的构造涉及
因果推断和因果结构的学习是一个新兴的研究领域.在统计学中,相关和因果的讨论由来已久,但统计学家对相关问题的研究远多于对因果的研究.有关因果的研究主要包括两部分:其一