基于可扩展的支持向量机分类算法及在信用评级中的应用

来源 :东华大学 | 被引量 : 5次 | 上传用户:kylinbin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机作为一种基于统计学习理论的新型机器学习方法,较好地解决了非线性、高维数、小样本等实际问题,是机器学习领域新的研究热点。但是目前来说支持向量机具有鲁棒性较差、学习效率较低、分布式学习通信量大等缺陷。因此,本文针对支持向量机进行改进研究,包括在原有二叉树支持向量机基础上引入后验概率、在引入后验概率的基础上将支持向量机向多类分类问题进行扩展、针对对等传感器网络的完全分布式的支持向量机学习,并在企业信用评级系统中进行应用研究。具体来说,本文的主要工作和创新点总结如下:(1)后验概率支持向量机方法对孤立点和噪声具有鲁棒性,并且可以减少支持向量的数量,从而降低了计算复杂度。因此,针对最近提出的快速分类算法c-BTS,引入样本的后验概率,提出了一种基于后验概率的SVM决策树算法(P2BTS)实验结果证明,P2BTS比c-BTS的分类精度更高,且基于后验概率支持向量机(PPSVM)的P2BTS所需的二类分类器个数明显比c-BTS少,这在一定程度上减少了P2BTS分类决策的时间和比较的次数,提高了分类效率(2)在考虑Fisher比可分性测度的基础上,将PPSVM扩展到多类分类问题,提出两种决策树结构的PPSVM算法,分别为多对多PPSVM决策树和一对多PPSVM决策树。性能分析表明,无论是多对多方法还是一对多方法,两种树都包含n-1个PPSVM分类器。两种算法的平均收敛率分别为O(log2n)和O((n!-1)/n)。实验表明,所提出的算法在提高分类精度的同时,减少了所需的支持向量数目和二类分类器个数,提高了分类效率(3)针对点对点传感器网络,基于平均一致性算法,提出了一种完全分布式的可扩展支持向量机分类算法(DS2VM)。该算法的主要优势是其训练过程仅需要局部智能体自身的样本,然后只与其相邻节点进行通信就能对全局分类器达到网络范围的一致性。由于所提出的算法仅需相邻节点之间的信息交换,因此是规模可扩展的。另外,提出了一种新的平均一致性,并对其收敛性和稳定性进行分析。通过对UCI机器学习数据库的实验分析,证明了所提出的DS2VM分类算法非常接近集中式最优分类精度,且通信代价较传统分布式SVM算法大大减小(4)改进算法在信用评级系统中的应用。巴塞尔新资本协议希望并鼓励各银行发展内部信用评级系统,而信用评级本质上是一个非线性、小样本问题,样本往往是含噪声或者孤立点的,并且已有样本不可避免存在模糊或错误类标。因此,将以上改进的SVM分类方法应用在信用评级系统中,就是十分自然的想法了。本文建立了基于改进SVM算法的标准化、层次化评级决策支持系统模型。实证分析表明了所提出新算法的有效性。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
基于无反馈控制方法研究超混沌电路系统的混沌控制。通过稳定性分析和数值计算,表明系统存在两个不稳定的鞍点,分岔图和特定区域的相图和时序图进一步证明了系统存在超混沌行
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
利用锥上的不动点定理对一类具有P—Laplacian算子差分方程系统正解的存在性进行了讨论,得到该问题存在一个正解、多个正解及正解的不存在性的充分条件.
西部山区河段具有水面比降大、河床推移质粒径粗、糙率较大等特点,因此西部山区河段的水沙特性与平原河流差异明显,采用现有的推移质输沙公式来预测山区河段的泥沙输移情况存
“冻融期滑坡形成机理与滑移特征研究报告”项目是关于冻融期滑坡的全面、系统的研究,其中广义滑坡类型划分、基本特征、复活特征的研究可指导滑坡险情应急处理中的预防措施、
本文在对产业集群成长、效应理论,企业国际化过程、因素理论,以及企业成长外生、内生特别是网络化成长理论梳理基础上,针对全球经济一体化时代背景下各国产业集群化发展趋势,
以额济纳的沙枣树为研究对象,用Li-6400便携式光合测定仪和便携式荧光仪于2013年6月测定了沙枣叶片净光合速率(Pn)的日变化及不同CO2浓度下(Ca)的光反应曲线,分析了沙枣的光合日变化特征及其净光合速率(Pn)、气孔导度(Gs)和环境因子相互之间的关系,结果表明:沙枣的光合日变化呈双峰曲线,与气孔导度(Gs)、蒸腾速率(Tr)的日变化几乎相同,说明光辐射(PAR)的增强引起了沙枣光合对策的