海量样本下的支持向量机研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:haivi2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machines,SVM)是Vapnik等人提出的一类新型机器学习方法。由于其出色的学习性能,近年来已成为机器学习界的研究热点,并在很多领域都得到了成功的应用,如生物信息学、人脸检测、手写体数字识别等。但支持向量机尚有许多问题有待于理论和算法的发展和完善,如海量样本下求解过程的冗余问题,对强噪声的敏感问题,多类别分类问题等。这些问题制约着支持向量机在各个领域的进一步应用以及该算法对各种类型原始数据的支持。特别是对于海量样本的处理,支持向量机在训练速度和训练精度上还有待提高。高效、快速的实现方法是支持向量机进一步实用化的关键技术,因此本课题着重研究海量样本下的支持向量机的求解算法,主要从样本的预处理和工作集选择策略两方面着手,解决海量样本下支持向量机求解过程的冗余问题。本文首先详细分析了支持向量机算法及其训练过程,剖析了现有的一些算法在运算过程中的迭代机理;深入分析了支持向量机计算迭代过程中迭代缓慢的主要原因;进而从样本预处理和减少工作集选择代价方面提出了相应的改进策略,有效地加快了海量样本下支持向量机的快速训练算法。本文主要工作包括:1.系统分析了支持向量机的理论基础及其训练问题的数学描述,SVM训练问题归结为解一个带有线性等式和不等式约束的大规模凸二次规划问题。概括了SVM的泛化性能,并对当前流行的一些快速分解算法进行了详细的对比分析。2.研究了海量样本下支持向量机的样本约简策略。样本约简的目的就是将支持向量预先提取作为新的训练集,减小训练代价。本文概括了样本约简的三大思路,并提出了一种新的约简算法——基于K-邻界子聚类区的样本约简算法。该算法提出K-邻界子聚类区的概念,该区域基本覆盖了两类样本的邻界区域,有效地改善了现有算法中邻界样本提取不全的缺点。3.深入研究了SVM工作集的选择策略。工作集选择是SVM优化算法的关键步骤,直接影响着SVM的训练速度。本文重点讨论了三种常见的训练算法:SVMlight、Platt的SMO和LIBSVM。这些方法采用了可行方向法、缓存和收缩策略,极大的提高了训练速度,但也存在着迭代冗余的问题。针对这一问题,本文提出了一种新的海量样本下的快速训练算法——基于预备工作集的最小序列优化算法。该算法的预备工作集策略能够有效地避免了大量冗余的迭代计算步骤和违反KKT条件的样本排序,并引入核缓存策略,使得每次迭代的开销减少,加快了大规模样本的训练速度。
其他文献
磁流变半主动悬架系统响应速率快、构造简单、功耗低,又能接近主动悬架的控制效果,是目前颇具应用前景的轿车减振方式。由于环境温度、磁流变阻尼器的能量耗散生热以及通电线圈
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
2020年,是全面建成小康社会的收官之年.党的十九大指出,全面建成小康社会,要紧扣我国社会主要矛盾变化,统筹推进经济建设、政治建设、文化建设、社会建设、生态文明建设,突出
期刊
温度的测量与控制在国防、军事、科学实验及工农业生产等各个领域都具有十分重要的作用。红外非接触温度测量方法以其独特的优势得到广泛应用。随着现代科学技术的突飞猛进,要求制造具有各种功能的特种材料,热导率和热扩散率是描述材料热物性的重要参数。据统计分析,世界上大约有75%的材料热导率及热扩散率数据是用激光脉冲法测得的。本文开发的快速温差测量仪就是非接触温度测量在激光脉冲法测量材料热导率中的具体应用。本文
混响信号是伴随着声源信号一起生成的,它会对主动声纳造成显著的干扰,在近程混响环境下该现象尤其明显,混响制约了主动声纳系统的应用以及相关数据的分析,所以对海洋混响的研究有
校园安全信息通信管理系统(以下简称“校安通”)是利用高科技的射频识别技术、手机短信服务平台技术、语音技术和计算机信息处理技术等开发而成的具有科技先进水平的综合校园
目的:研究分析瑞芬太尼复合麻醉患者苏醒期躁动中地佐辛的临床应用价值.方法:选择2018年01月到2019年03月收治的90例需要全身麻醉的患者进行研究,随机分为两组,每组45例.对照
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
为满足低成本,高性能导航要求,解决传统单一主惯导系统的成本高,体积大且无法排除载体局部运动对导航性能的影响等问题,本文利用低成本MEMS传感器,采用传感器斜装冗余配置,并