论文部分内容阅读
针对实际数据中正、负类样本存在的聚集和分散特征,提出了一种处理两类分类问题的新型支持向量机——基于聚类的分组支持向量机分类方法。通过k-均值聚类算法对正、负类样本分别聚类,将其划分成几个小组,交叉结合训练出不同的SVM分类器,对测试样本根据其与聚类中心的加权欧氏距离选择特定的SVM分类器判断其类别,简记为GC-SVM。该方法将分类效果不好的一个二分类问题细化为多个简单的二分类问题,实验结果表明该算法在一定程度上提高了分类的准确率。