支持向量机的特征选择和模糊支持向量机上的研究

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:venus1231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展及数字化时代的来临,产生了越来越多的高维数据。尽管这些数据非常值得学习和研究,但维数的增加意味着要花费更多的时间去计算,并且在机器学习中,容易产生过拟合现象。在处理分类问题的过程中,特征选择被证明可以有效的应对高维数据。特征选择致力于去除数据的不相关或多余特征。通过寻找原问题的一个特征子集,特征选择可以有效地降低数据的维数。从而,在机器学习过程中,非常值得去研究如何进行特征选择。近年来,虽然许多特征选择方法被提出,但很少有人考虑特征之间的相关性。本文提出了一种新的特征选择方法,以特征间的相关性作为特征选择的依据,考虑应用单一特征等价的代替其他与之相关的特征,从而达到寻找特征子集,降低数据维数的目的。实验结果表明,此方法在保持分类正确率的前提下,可以有效减少特征的个数。此外,由于各种客观原因,数据中不可避免出现噪音数据,从而给机器学习带来困难,影响机器学习的结果。模糊支持向量机,作为传统支持向量机的一种改进模型,提出了隶属度的概念。通过赋予正常的样本点较高的隶属度,相反的,赋予噪音较低的隶属度,可以有效的降低噪音对机器学习的影响。本文提出应用将样本点到超平面间距离与样本点密度相结合的方法,计算模型的隶属度。实验结果表明,此方法可以有效提高支持向量机分类的正确率。
其他文献
本文构造了弱Hopf代数上的两种结构,全文主要内容如下:  第一章,简单介绍了弱Hopf代数的背景及其研究现状,讨论了弱Hopf代数的一些性质,阐述了问题的提出和解决问题的思路及研究
在我们身前背后,总能听到学生说:“我不喜欢习作.”“我的习作怎么写都是一个样,没有什么提高,没兴趣.”究其原因,皆因习作很难.因此,让学生“易于动笔”、“乐于表达”,体验
非参数密度估计在统计学中具有重要的理论意义和应用价值.大量文献研究单个随机变量的密度函数.然而在保险理赔及其它实际应用中,人们更加关心多个随机变量和的密度函数.因为
该文讨论了成批到达的具有第二次多种选择服务的排队系统.在该系统中,只有一个服务台,顾客的到达形成一广义泊松过程.不同批的顾客按先到先服务的规则,而一同批的顾客则按随
在对例外序列的研究中垂直范畴是一个重要工具.该文第一章给出了全文所涉及到的基本概念,并对文章的背景加以介绍.第二章借助垂直范畴得到了关于有限表示型遗传代数,任意有限
该文详细研究了非线混合整数规划和遗传算法各自的特点,在此基础上,提出了初始群体飘移的思想和变尺度整型细密网格技术,构造了一种求解混合整数非线性规划的新的遗传算法--
本文主要研究余拟-Hopf代数上的Smash余积的一些性质及结论。全文内容如下: 第一章,介绍了余拟-Hopf代数的背景知识、研究情况及与之相关的一些基本知识,阐述了问题提出的思
该文主要针对指纹图象的特点,建立了基于Gabor变换的一套完整的图象前期处理技术体系,很好地抑制了图象的噪声,增强了指纹的结构特征,为特征点的提取和比对奠定了良好的基础.
军事仿真的视景开发中包含了三维视景和二维态势这两个主要组成部分.相关领域的研究随着硬件技术水平的不断提高而不断取得新的进展.该文首先概要介绍了如何用数学的基本理论
6月29日上午,自治区党委隆重召开纪念中国共产党成立83周年暨全区先进基层党组织、优秀共产党员和优秀党务工作者表彰大会。南宁市建设局党委等100个基层党组织、王全等100名