基于支持向量数据描述的分类识别算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:gb1107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计学习理论(SLT)是Vapnik等人提出的一种小样本统计理论,主要研究小样本情况下的统计规律及学习方法性质。它为机器学习问题建立了一个较好的理论框架,并且在这框架下发展出了一种新的学习方法--支持向量机(SVM)。支持向量机能较好地解决许多学习方法中的过学习、高维数、局部极小点等实际问题。在实际应用中,它不输于神经网络或决策树等方法。作为小样本学习的最佳理论,统计学习理论和支持向量机受到越来越广泛的重视,已经成为人工智能和机器学习领域的研究热点。然而,由于出现的时间较晚,支持向量机在很多方面还不成熟、不完善,需要进一步地研究和改进。在众多研究中,支持向量数据描述(SVDD)方法凭借其良好的性能得到了广大研究者的重视。本文主要讨论了以下内容:第一章和第二章主要介绍了支持向量机的研究背景、研究现状,阐述了统计学习理论以及二类支持向量机的主要思想和解决方法。第三章引入支持向量数据描述,讨论了多种求解方法,然后通过实验对各种方法进行比较。SVDD的基本思想是对给定的样本集构造一个最小包围球,这个最小包围球尽可能多的包含样本集中的样本。支持向量数据描述可以写成与支持向量分类器(SVC)类似的形式。它把数据映射到高维特征空间中,但并没有增加额外的计算代价。这种映射使得算法能更灵活地处理问题。当样本点的维数较大时,传统的求解支持向量数据描述方法显得很无力。因此,人们把注意力转向近似算法。其中一种近似算法可以利用核集有效的求解出(1 +ε)-近似的支持向量数据描述问题。这种方法把核集当作样本集的一个近似,通过反复的对核集求解最优化问题来得到原始优化问题的解。令人惊讶的是,核集的最终大小与样本维数和样本个数都无关。第四章介绍了核向量机,并提出了新算法。标准SVM在训练的时候需要O ( m3)的时间复杂度和O ( m2)的空间复杂度,m为样本个数。因此当样本数巨大时,标准SVM的训练变得十分困难。核向量机(CVM)展示了SVM的二次优化问题可以转化为硬间隔SVDD的等价形式。实验表明CVM在预测时与SVM的预测精度相当,但CVM的训练速度更快,可以处理大规模数据。在此,本文提出SVM的二次优化问题可以转化为软间隔SVDD的等价形式,并通过仿真实验与已知方法比较,说明了本文提出的这种方法的有效性。第五章介绍了高斯核的性质、它对SVDD性能的影响以及一种高斯核参数优化算法。在众多核函数中,高斯核凭借其特殊的性质,得到了许多研究者的重视。然而,研究表明,SVDD的性能受高斯核参数的影响很大。因此,最优高斯核参数应该使得特征空间中的样本分布趋于超球形。基于仿真数据的实验说明了该方法的有效性。第六章总结文章的主要工作,并对未来进行展望。
其他文献
学位
互联网的发展和普及导致信息成数量级的增长。海量的信息在极大丰富人们生活的同时,也给互联网用户带来很大的困扰。人们在面对泛滥的信息时无所适从,陷入信息过载的困境。由
随着科技的发展和经济繁荣,工作流技术在计算机应用领域迅速发展,它可以优化企业经营业务流程,促进各部门协调工作,提高企业的办事效率,增强企业的竞争力。但由于针对工作流
随着现代社会对计算能力和信息处理速度要求的不断提高,如何提高CPU处理能力成了亟需解决的问题。传统的依靠提高CPU主频来提高处理能力的方法由于受到功耗和设计复杂度的制约
随着无线移动通信技术的飞速发展,未来的B3G/4G移动通信系统将会是由多种无线接入技术融合而成的异构网络。其中移动节点如何选取一个最适合的网络,成为异构网络融合的关键问
随着数字技术、网络多媒体和通信技术的迅速发展和应用,版权保护与认证显得越来越重要,数字水印技术的出现为这类问题的解决提供了很好的解决方案。一般的水印在嵌入提取过程
随着P2P技术的发展,其在互联网应用中越来越显示出优越性和重要性。它是一种不依赖服务器的分布式网络模型,具有良好的可用、健壮、扩展和容错等性能。而移动通信服务可以从
近些年来,随着深度相机的技术越来越成熟,深度图像在生产实践中得到了广泛的应用。由于深度图像中每一个像素点不仅有颜色值,还有相应的深度值,这为以前在计算机视觉和图像处
聚类分析作为数据挖掘的一个重要研究分支,根据在数据中发现的描述对象及其关系的信息,依据各簇内对象相似性最大化和各簇间对象相似性最小化的基本聚类分析原则,将对象划分
学位
随着移动通信和互联网的发展,中国电信提供的固定电话业务已经渐渐失去市场份额,如何保留客户是中国电信面临的严峻问题。积分商城作为积分运营模式的一种实现为企业带来生机