论文部分内容阅读
在统计机器学习的研究中,研究者常常通过定量实验来对照基于交叉验证的分类算法的F1 度量,为了得到统计可信的结论,估计它的不确定性是非常重要的。特别地,组块3×2 交叉验证方法被大量理论和实验验证了它的性能优于诸如标准K折交叉验证的其他常用交叉验证方法。为此,理论上研究了基于组块3×2 交叉验证的F1 度量的方差。方差的结构表明它由块方差、块内协方差和块间协方差三部分组成,从而说明了广泛使用的样本方差估计可能严重地低估或高估真实的方差。通过条形图方法在模拟和真实数据上进行实验,验证了上述