基于SVM的分段贪婪算法研究

来源 :西安科技大学 | 被引量 : 4次 | 上传用户:xy_lfr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machines,简称SVM)是V.Vapnik等在20世纪90年代提出的基于统计学习理论(Statistical Learning Theory,SLT)的一种新型机器学习方法。由于其完备的理论基础和优异的性能,该技术已成为机器学习界的研究热点,并在很多领域都得到了成功的应用,如模式识别、数据挖掘、生物信息学等。相对于理论的完善性来说,SVM的算法研究明显滞后,尚有许多问题急需发展和完善。如海量样本下求解过程的冗余问题,训练算法速度慢,对强噪声的敏感问题,多类别分类问题等。这些问题大大制约了SVM在各个领域的进一步应用。特别是对于海量样本的处理,支持向量机在训练速度和训练精度上还有待提高。因此本课题着重研究海量样本下的SVM的训练算法,主要从大规模样本集的约简方法和训练SVM的分段贪婪算法两方面着手,解决海量样本下SVM训练速度和精度不能兼顾的问题。 本文首先对SVM的基本理论进行了介绍,然后对大规模数据集上SVM的训练算法作了系统的研究,并详细研究了流行的SMO算法,接着研究了SVM的分段贪婪算法和处理SVM大规模训练样本集问题的约简算法。在此基础上给出了一种新的SVM分段贪婪算法-YGS-SVMs。本文主要工作包括: (1)系统论述了支持向量机的理论基础及其主要研究内容。 (2)对大规模数据集上SVM的训练算法作了系统的研究,并对其中流行的SMO算法作了深入探讨。 (3)深入研究SVM的分段贪婪算法和SVM大规模训练样本集问题的约简算法。在其基础上提出了一种适用于大规模训练样本集的快速训练算法--基于大规模训练集快速约简的SVM分段贪婪算法。
其他文献
本文研究几类非线性发展方程(组)解的定性性质:初值或初边值问题解的整体存在性、衰减行为和有限时刻爆破等.主要内容安排如下:   第一章叙述相关研究工作的背景与发展概况,并
威布尔分布是可靠性系统与分析的重要分布之一,在可靠性系统与分析中有着重要的地位。但由于威布尔分布的分布函数和密度函数形式的复杂性,因此参数估计比较困难,也影响了威
本文主要研究非线性系统的拓扑线性化及稳定性的有关问题,全文由四章组成.   第一章对非线性系统的拓扑线性化及稳定性问题的历史背景及现状进行了综述.   第二章简要
检测图像中是否存在汽车或其他目标(如行人、树木、建筑物等)有着重要的民用和军用价值,因此成为近年来计算机视觉和模式识别中的一个研究热点。国内外的学者针对该问题已经进
现代物流的理念和运作对众多物流企业产生了深远的影响,如何将物流、信息流和资金流进行全面的整合与有效的控制,从而提升企业的竞争能力,实现产品供应链的价值和运作的最优化,是
本文利用供应链库存理论、运筹学、多目标优化理论和不确定理论等有关知识对三级供应链库存建立了相关模型。通过对供应链库存的分析和模型假设,将供应链库存问题转化为不确定
在寿险精算中,利率和死亡率的测算是厘定寿险成本的两个基本问题。由于寿险保费的收取与保额的给付不是同时发生的,其间有一段较长的时间间隔(往往一年以上),使得寿险公司一直被利
本文把一类自治时滞微分方程的周期解的存在性问题用多种方法推广到非自治的情形.当方程中的函数f依赖于变量t时,这给问题的讨论带来实质性的困难.本文就这个问题做了下面几方
模拟自然景物是计算机图形学中研究的一个重要课题。自然景物在外形上的随机性和不规则性难以用传统的方法加以描述。70年代B.Mandelbort提出分形概念后,其作为一门新兴的交
按照神经生理学的观点,生物神经元本质上是随机的,因为神经网络重复地接受相同的刺激,其响应并不相同.这意味着随机性在生物神经网络中起着重要的作用.随机神经网络模型的稳