论文部分内容阅读
针对支持向量机处理大数据量时存在的训练时间、内存空间消耗过大的问题,首先提出了一种压缩K-近邻边界向量的支持向量预抽取算法(CKNN),并进行了仿真。仿真结果表明:CKNN算法无论对于线性可分数据集,还是高度非线性的螺旋曲线数据集,均能在推广能力较小损失的前提下,大幅裁剪训练样本;然后,进一步采用5个UCI标准数据集仿真验证CKNN的有效性,结果表明:大数据量情况下效果更优,但代价是SVM推广能力略有损失。