论文部分内容阅读
为了提高不平衡数据集中少数类的分类准确率,文章对组合分类算法进行了研究,提出了一种新的组合分类算法WDB。该算法采用决策树C4.5和朴素贝叶斯两种不同的分类器作为基分类器,选择精确度(precision)作为权值,根据不同的训练集,通过“权值学习”的方式自动调整各基分类器的权值大小,然后,结合各基分类器的预测结果,利用加权平均法进行代数组合,构造出一种新的分类算法WDB。最后,以开放的不平衡数据集作为数据源,利用常见的性能评价指标进行实验验证。实验结果证明,在组合分类算法中引入“权值学习”能够发挥基分类器