论文部分内容阅读
提出一种适用于多类不平衡数据的集成学习方法,以解决多类样本分布不均衡问题.首先,利用合成少类样本的过采样技术(Synthetic Minority Over-sampling Technique,SMOTE)得到一组类别平衡的训练集.然后,对每个训练集采用二叉树支持向量机(SVM of Binary Tree,BTS)进行训练,最后,采用Bagging进行集成.通过5组UCI测试数据表明该算法在Gmean参数上比SMOTEBagging算法提高2.55%.