组块3×2 交叉验证的F1度量的方差分析*

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:liangdd1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在统计机器学习的研究中,研究者常常通过定量实验来对照基于交叉验证的分类算法的F1 度量,为了得到统计可信的结论,估计它的不确定性是非常重要的。特别地,组块3×2 交叉验证方法被大量理论和实验验证了它的性能优于诸如标准K折交叉验证的其他常用交叉验证方法。为此,理论上研究了基于组块3×2 交叉验证的F1 度量的方差。方差的结构表明它由块方差、块内协方差和块间协方差三部分组成,从而说明了广泛使用的样本方差估计可能严重地低估或高估真实的方差。通过条形图方法在模拟和真实数据上进行实验,验证了上述
其他文献
本刊讯 国家安全监管总局5月25日发布消息称,各地区通过开展造纸和酱腌菜生产企业有限空间作业条件确认工作专项检查,有效遏制了有限空间事故易发多发的态势,但仍有企业存在违规
用客观翔实的数据描述了我国近30年来高等教育政策的比较研究状况,高等教育政策的比较研究呈现出如下特点:涉及的国别范围扩大,研究者的身份多样化,关注的内容越来越广泛,文章形式
传统的机器学习算法把数据表示成向量的形式进行处理,而现实世界许多应用中的数据都是以张量形式存在的,如图像、视频数据等,如果将这些本质上非向量形式的数据强制转换成向量表
为了有效提高正电子发射断层成像图像的质量,通过把各向异性中值扩散滤波器融合到中值根先验算法中,提出了一种新的基于Bayesian 理论的图像重建算法。新算法的每次迭代过程都
高科技的推动,使我国的造纸行业进入高速繁荣时期。特别是《造纸工业发展“十二五”规划》实施以来,作为与国民经济发展和社会文明进步息息相关的制浆造纸业面临着各种挑战和
影响最大化问题是在社会网上寻找最具影响力的种集。目前的研究工作忽略了影响传播最大化和利润最大化的区别,以及影响范围会随着时间的推移趋于平稳。考虑用户动作日志,提出
随着电子商务的快速发展和用户在线评论数据的迅速增加,产品评论检索面临更多的挑战。一方面,产品评论从更为主观的角度为产品的特性提供描述;另一方面,产品评论的数据特性要求对
蛋白质复合物的检测对人类了解细胞组织和疾病预测起着至关重要的作用。然而,当前的蛋白质复合物识别方法的准确率低,对噪音敏感等缺点导致其识别效果并不理想。提出了一种新的蛋白质复合物识别方法PIOC(pigeon-inspired optimization clustering)。该方法根据蛋白质复合物的特性提出了簇的紧密邻接点概念和附件对核心的附着度概念,基于这两个概念,PIOC通过模拟鸽子优化算法中
如图1所示,造纸机干网在线清洗机包括机架和清洗装置。机架上设有小车、导轨和驱使小车在导轨上移动的电动机。清洗装置安装在小车上,清洗装置运动区域的下方设有接水盘,清洗装
欧洲琼花忍冬科、荚蒾属.落叶型灌木,树高2.4至3.6米,冠幅3至4.5米.单叶、三裂、对生,长、宽为5至10厘米.花期五月,白色小花,聚伞花序,在绿叶的衬托下显得格外迷人.夏季的叶