论文部分内容阅读
作为支持向量机的重要分支算法,一类支持向量机及多球体聚类算法在异常检测、聚类学习等无指导领域得到了良好的应用。本文在深入研究一类支持向量机理论的基础上,给出一类支持向量机的作用集训练算法,从改进核聚类算法出发提出多球体理论框架,并进一步与有指导分类器融合以增强其训练速度和分类正确率,使之能适应现今大样本训练和实时决策的学习趋势。本文的主要工作包括:(1)提出一类支持向量机的作用集训练算法,并引入递推方法求解无约束优化的线性方程。该算法寻找支持向量在最优状态下的分布,无需逼近目标函数,避免使用KKT容忍值,并可获得解析的最优解,从而提高了一类支持向量机的训练效率。(2)为解决一类支持向量机核聚类的距离参数问题,提出模糊核聚类算法,定义具有支持向量特性的模糊隶属度函数替代距离参数,通过惩罚边缘样本的权重抑制聚类中心的偏移,不失鲁棒性地避免了参数搜索过程。同时,在核聚类算法基础上提出多球体理论框架。(3)扩展多球体理论框架至有指导学习并构造多球体分类器,引进精简一对多分类器以分离多球体内的混叠样本。构造组合分类器将上述两个性能互补的分类器加权组合,并给出基于交叉验证的权重估计和参数搜索策略。相对于传统的一对多算法,组合分类器显著减少了训练时间和决策时间,提高了分类正确率。(4)针对一对一算法的成对耦合决策规则的实时性问题,使用多球体分类器获得样本与类别的模糊隶属度,引进预分类算法挑选部分隶属度较高的类别参与决策,显著降低决策计算量。给出固定候选集容量和K均值两种预分类算法。前者固定参与决策的类别数,通过调节容忍参数权衡决策时间和分类正确率,以牺牲一定正确率为代价获得较快的决策速度;后者采用K均值聚类得到隶属度较高的类别,考虑了不同样本的模糊隶属度特性,因而其分类正确率无明显下降。(5)针对车牌识别项目,采用图像线性变换完善车牌字符样本库,并将本文提出的基于多球体理论框架的分类器应用于车牌字符识别模块,通过比较实验,最终在项目中选取基于K均值预分类的一对一成对耦合算法。