基于优化的分类超平面支持向量算法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户：asergh12

【摘要】

：

传统机器学习的方法是以假设样本集趋于无限为前提的,但实际问题中样本集都是有限的。Vapnik等人针对小样本提出了统计学习理论(Statistical Learning Theory,SLT),支持向量

【作者】

：

徐健

【机构】

：

桂林电子科技大学

【出处】

：

桂林电子科技大学

【发表日期】

：

2007年期

【关键词】

：

医学图像处理大规模数据集分类超平面支持向量算法二次规划代数方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

传统机器学习的方法是以假设样本集趋于无限为前提的,但实际问题中样本集都是有限的。Vapnik等人针对小样本提出了统计学习理论(Statistical Learning Theory,SLT),支持向量机(Support Vector Machine,SVM)就是基于SLT的一种新的机器学习方法。由于SVM严格的理论基础和很强的实际应用能力,已经成为现今机器学习、数据挖掘等方面的热点研究方向。　　本文主要对SVM在处理大规模数据集时速度慢的瓶颈,改进算法,讨论相关理论,数值实验和实际应用的结果表明算法是有效的。具体工作表示如下:　　第一在理论方面,提出由最大间隔法和平分最近点法将SVM分为代数方法和几何方法,并由此线索论述本文,最后证明这两种方法得到的是同一个分类超平面;讨论了二次规划(QP)与代数方法的联系,阐述了QP算法的改进;结合泛函分析工具对几何算法进行规范,将寻找两凸包间最近点的操作简化为寻找一个凸包中最小二范数的操作;分析了所述算法系列的收敛性和时间复杂度。　　第二在算法改进方面,首先结合矩阵形式和公式变换得到一个求解支持向量的代数方法改进;然后对最小序列法(SMO)进行阈值和搜索方面的改进,建立基于缓存机制的SMO算法;提出一种预处理数据集的方法,通过删除同类点,异类点和孤立点三种操作删除了重复反映分类特性的样本点,同时减少了样本集;最后为几何方法设计一个迭代算法。　　第三在数值实验和实际应用方面,本文做了数值实验来验证以上算法改进的效果,并分析原因;将SVM算法和预处理算法应用于医学诊断识别中,对来自美国威斯康辛医学院的乳腺癌数据进行训练和测试,得到了很好的分类效果,并且验证了预处理方法在减少运算时间的同时保证了分类正确率,而且在一定情况下可以得到更好的分类精度。

其他文献

基于变换域的双重图像盲水印研究

随着计算机通信技术的飞速发展,数字多媒体信息的传递也随之越来越迅捷,但同时也带来了信息安全的隐患,对信息的版权及完整性提出了挑战。数字图像水印技术是利用水印的不可

学位

变换域双重图像盲水印动力系统攻击实验

三维群体的几何布局及参数优化识别

学位

拟三维煤层气的数学模型和数值模型

学位

地下水水质污染问题的广义解及混合元--特征有限元方法

学位

Navier-Stokes外部流动的虚拟区域方法