论文部分内容阅读
为提高传统支持向量机训练速度,解决由于原始数据量过大导致传统支持向量机计算复杂度高的问题,提出了缩减训练集规模的方法. 针对传统支持向量机中存在原始数据量过大导致训练速度太慢的问题,同时考虑到非支持向量对支持向量机的训练性能无影响,且影响支持向量机性能的支持向量往往位于边界的特点,提出两种提取边界向量的支持向量机算法.一是基于中心向量的边界向量提取算法,通过两类类中心计算类中心连线的垂直平分面,根据各样本到垂直平分面的距离对样本进行保留;二是基于向量投影的边界向量提取算法,将所有样本投影到两类类中心的连线上,计算各样本到两个类中心的距离,根据距离的大小进行保留,并在保留样本中剔除噪声样本.数值实验表明:改进的两种算法均在保证支持向量机分类性能的前提下,有效提高了支持向量机的训练速率.