快速SVM训练算法研究及其高效参数选择方案

被引量 : 0次 | 上传用户:mobydick2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(SVM)是近年来流行的机器学习方法。根据统计学习理论,SVM的推广错误率的上界随分类间隔的增大而减小。SVM算法提出的目的是最大化分类间隔,并且保证有较小的推广错误率。然而在SVM算法的实际应用中,存在着三大必须解决的问题:算法速度问题,支持向量存量问题和算法参数选择问题。目前主流的SVM优化方程和训练算法中不存在同时满足速度快、内存占用少并且支持向量少的算法,主要困难在于SVM训练过程中支持向量个数太多。本文首先对基于SV修剪技术的一种二合一方法提出一个复杂度仅为O(1)的快速实现,然后创造性地提出在SVM训练算法中嵌入该SV修剪方法的一种新SVM训练算法NullSVM。在该算法过程中,每当支持向量数超过给定阈值的时候将进行高效的SV修剪以实现同时提高算法速度、降低内存占用和得到较少的支持向量解的目的。诚然,SV修剪过程中带来的误差会对算法性能造成影响,然而实验表明,虽然NullSVM方法在部分分类问题上识别率会稍低,其速度会得到极大的提升,因此该方法能够基本解决算法速度问题和支持向量存量问题。为了解决SVM算法的参数选择问题,本文根据统计学习理论的结构风险最小化原则,选择结构风险作为评价函数,从不同的参数组合中选择出最优的参数。研究表明结构风险中计算复杂度最高的因子是向量集的最小包球半径R,其复杂度为O (N~3)。因此提出用最大向量距离D代替此R,使得计算复杂度降为O (N~2),如此的改进所产生的误差满足一定的上界。NullSVM包含两个参数C和σ,对固定的σ,较大C参数的可行域包含较小C参数的可行域,所以可以直接把较小C参数的解作为较大C参数的迭代初始值以加快算法的收敛速度。所提出的NullSVM算法能从一个小的C初始值开始,连续计算出从小到大一系列C值的解。基于结构风险评价的参数选择方案利用该特性,实现快速搜索并对一系列的参数作出评价。实验表明,此参数选择方案速度上比常用的基于交叉验证法的参数选择方案有约5倍到10倍提高,识别率更稳定并且不容易过学习,仅在某特定参数搜索范围情况下识别率稍差。
其他文献
21世纪以来我国的个人商业信用也得到了巨大的发展:房价的一路飙升,使大多数城市的市民只能通过在银行等金融机构的按揭贷款来购买房屋;教育贷款也使许多贫困地区的考生顺利
解放战争时期,由于美国“扶蒋反共”政策的确立,中国共产党被迫将抗日战争时期确立的“联美抗日”政策,改为“中立美国”的政策。在反对美国武装蒋介石集团,支持蒋介石利用内战消
多年来,伊犁地区的锡伯人在不少人眼里都充满了神秘的色彩。当年他们为何要从东北迁徙到遥远的新疆?如今生活在乌孙山下的锡伯人,难道真是清乾隆年间成边将士的后裔?这个自古
<正>徐意遐:对于今年高考上海卷的作文题目,网上有一些评价。有的说比较难写;有的说这个题目很好,需要重新去思考,无法套用以前的一些作文;还有的说上海高考作文现在年年都是
人的智能是多元的,是先天存在而又是可以后天开发的;每种智能都有其脑生理基础,都是其生物的本能;每个人都在一定程度上拥有其中的多项智能。多元智能理论认为,智能是指解决
灌溉对于保证农业稳产与丰收的作用是无需置疑的,但是,由于灌溉水资源严重不足,水资源的地域分布不均衡,成为发展灌溉事业的严重障碍。我国是一个淡水资源相对缺乏的国家,随
目的观察单纯滴鼻致敏豚鼠上下气道的症状及病理改变。方法健康Hartley豚鼠随机分为单纯滴鼻组(实验组,1 5只)及空白对照组(对照组,1 0只)。实验组及对照组经基础致敏和激发
<正>高中生的创新素养的培育是一项长期的系统工程,也是基础教育改革的迫切需要。如何落实到学校教育中是创新教育最终落地的关键所在。七宝中学校长仇忠海对高中生的创新素
本文提供了1种难浸金精矿的湿法预氧化新工艺,它包括细磨、强化碱浸预氧化、氰化和炭吸附.在螺旋搅拌式塔式磨浸机中,先将目的难浸金精矿细磨至98%《37μm,然后在40%的矿浆质
<正>学校将原有的特色系列教育活动,整合于数字化平台中,研发以教育导向、过程记载、成功激励为主要功能的"上海市实验小学学生成长平台",使育人过程建立在数字化平台之上,依