论文部分内容阅读
支持向量机作为一种基于统计学习理论的新型机器学习方法,较好地解决了非线性、高维数、小样本等实际问题,是机器学习领域新的研究热点。但是目前来说支持向量机具有鲁棒性较差、学习效率较低、分布式学习通信量大等缺陷。因此,本文针对支持向量机进行改进研究,包括在原有二叉树支持向量机基础上引入后验概率、在引入后验概率的基础上将支持向量机向多类分类问题进行扩展、针对对等传感器网络的完全分布式的支持向量机学习,并在企业信用评级系统中进行应用研究。具体来说,本文的主要工作和创新点总结如下:(1)后验概率支持向量机方法对孤立点和噪声具有鲁棒性,并且可以减少支持向量的数量,从而降低了计算复杂度。因此,针对最近提出的快速分类算法c-BTS,引入样本的后验概率,提出了一种基于后验概率的SVM决策树算法(P2BTS)实验结果证明,P2BTS比c-BTS的分类精度更高,且基于后验概率支持向量机(PPSVM)的P2BTS所需的二类分类器个数明显比c-BTS少,这在一定程度上减少了P2BTS分类决策的时间和比较的次数,提高了分类效率(2)在考虑Fisher比可分性测度的基础上,将PPSVM扩展到多类分类问题,提出两种决策树结构的PPSVM算法,分别为多对多PPSVM决策树和一对多PPSVM决策树。性能分析表明,无论是多对多方法还是一对多方法,两种树都包含n-1个PPSVM分类器。两种算法的平均收敛率分别为O(log2n)和O((n!-1)/n)。实验表明,所提出的算法在提高分类精度的同时,减少了所需的支持向量数目和二类分类器个数,提高了分类效率(3)针对点对点传感器网络,基于平均一致性算法,提出了一种完全分布式的可扩展支持向量机分类算法(DS2VM)。该算法的主要优势是其训练过程仅需要局部智能体自身的样本,然后只与其相邻节点进行通信就能对全局分类器达到网络范围的一致性。由于所提出的算法仅需相邻节点之间的信息交换,因此是规模可扩展的。另外,提出了一种新的平均一致性,并对其收敛性和稳定性进行分析。通过对UCI机器学习数据库的实验分析,证明了所提出的DS2VM分类算法非常接近集中式最优分类精度,且通信代价较传统分布式SVM算法大大减小(4)改进算法在信用评级系统中的应用。巴塞尔新资本协议希望并鼓励各银行发展内部信用评级系统,而信用评级本质上是一个非线性、小样本问题,样本往往是含噪声或者孤立点的,并且已有样本不可避免存在模糊或错误类标。因此,将以上改进的SVM分类方法应用在信用评级系统中,就是十分自然的想法了。本文建立了基于改进SVM算法的标准化、层次化评级决策支持系统模型。实证分析表明了所提出新算法的有效性。