论文部分内容阅读
支持向量机(Support Vector Machine, SVM)是一种通用高效的机器学习方法,能较好地处理小样本、非线性、高维数据等实际问题,目前已经成为机器学习的研究热点,并广泛应用于模式识别、函数估计和时间序列预测等数据挖掘问题,然而SVM在解决实际问题时仍然存在一定局限性,如SVM的训练速度极大地受到训练集规模的影响、在特定的空间中泛化能力受到限制、应用领域有待于进一步拓展等。针对以上问题,本文将粒度计算(Granular Computing)思想引入SVM中,用以改进传统SVM分类器的上述缺陷。本文在粒度计算和支持向量机学习框架下,以多维关联规则挖掘为手段,提出一种粒度支持向量机(Granular SVM, GSVM)学习方法,称为AR-GSVM,并且在AR-GSVM的基础上提出一种核空间上的粒度支持向量机学习方法,称为AR-KGSVM。本文的研究内容主要有以下几个方面:(1)对现有的粒度支持向量机学习模型进行了深入系统的分析。(2)提出一种原始数据空间上基于多维关联规则的粒度支持向量机学习方法AR-GSVM,该方法不仅可以有效地降低分类器的复杂性,而且本质上的可并行计算可以提高其学习效率,同时算法重点考察靠近分类边界的数据(有可能是支持向量数据),从而保证分类器具有良好的泛化能力。(3)在AR-GSVM的基础上,考虑到算法在原始空间做粒划分而在核空间进行训练造成数据分布的不一致,而使泛化能力下降的情况,本文提出核空间上的粒度支持向量机学习方法AR-KGSVM,尝试先将样本映射到高维特征空间再进行粒划分,保证了粒划分和数据训练在同一空间,从而使学习器具有更强的泛化能力。(4)在标准UCI数据集上对本文提出的学习方法进行了验证,获得了良好的预期效果。本文提出方法的重要应用是对非平衡数据的处理,通过在标准数据集上与常用非平衡数据处理方法的比较,说明了本文提出的AR-GSVM和AR-KGSVM算法非常有效。本文提出的基于多维关联规则的粒度支持向量机学习方法,将强大的机器学习方法SVM与粒度计算思想相融合,研究成果不仅可以丰富SVM的理论和方法研究,同时SVM在非平衡数据处理的成功应用也有望进一步拓展SVM的应用领域。