论文部分内容阅读
特征证选择算法在文本分类中非常重要,本文就对其在层次分类中的应用进行了分析。通过比较DF,MI,和χ^2三个经典的特征选择算法在20NewsGroups数据集的表现,我们发现在SVMLight分类器下χ^2方法在层次分类中能够表现的更优秀,实验结果显示它在各个不同的特征维数下都能够保持稳定的优势。