【摘 要】
:
支持向量机(Support Vector Machine, SVM是一种新的基于统计学习理论(Statistical Learning Theory)的机器学习方法,根据有限的样本信息在模型的复杂性和学习能力之间寻求最
论文部分内容阅读
支持向量机(Support Vector Machine, SVM是一种新的基于统计学习理论(Statistical Learning Theory)的机器学习方法,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以获得更好的泛化能力.经典支持向量机认为所有的特征有相同的重要性,然而如果样本中包含着与目标函数弱相关甚至是不相关的特征时,就会在一定程度上影响分类器的推广能力.在一些真实数据集上,确实存在某些特征对分类贡献大,而其它特征对分类贡献小的情况,所以就提出了特征加权SVM算法.特征加权就是对每个特征赋予一个区间[0,1]中的数来表明该特征的重要性,越重要的特征就赋予越大的权值.本文把特征选择的一些方法应用到经典SVM中,提出了五种特征加权SVM算法,所采用的特征加权方法有:增益比率法,对称不确定性法,χ2检验法,Gini指标法以及Relief-F算法.然后本文提出了相对间隔的定义,并从理论上证明了在一定条件下,相对间隔越大,SVM的泛化能力就越好.最后在一个人工数据集和八个真实数据集上进行实验,并对实验结果进行分析和比较.本文提出的五种特征加权SVM算法与经典的SVM算法相比,在一定程度上提高了分类精度,并且在多个数据集上的支持向量个数都有所减少.
其他文献
二月河的“帝王系列”描写了一批重要的官吏,他们外形丑陋但有德有能,德才兼备。作家从大众的审美趣味出发来描写他们,既写形又传神。
从当前农村社会的现实来看,农村妇女的土地承包经营权益总是受到侵害,原因源于多方面。本文结合农村妇女难以获得平等土地承包权益的现状,来分析土地承包领域难以实现男女平
中国的发展伴随着城市的崛起。大城市在逐步成长的过程中,由于受到土地、环境等资源的制约,城市化进程开始向郊区扩散,郊区城市化由此而生。郊区城市化是中心城区离心力和郊
我国是钢铁生产和消费大国,粗钢产量连续13年居世界第一。进入21世纪以来,我国钢铁产业快速发展,粗钢产量年均增长21.1%。钢铁工业的快速发展,对铁矿石产生了巨大需求。从200
人参皂苷G-Rh2系人参中提取的达玛烷二醇型皂苷,为人参中具有显著抗癌药理活性的皂苷成分。许多研究证实,G-Rh2具有广谱抗肿瘤的药理活性,但其抗肿瘤作用信号转导调控机理仍
"被XX"与"被VP"差异明显,其具有[+矛盾性]语义特征,这是现实世界对语言的隐喻,体现的是对现实世界的主观化。"被XX"具有鲜明的语用特征。
目的重构肠道菌群Ⅱ型糖尿病大鼠模型脂类代谢变化比较,探讨肠道菌群潜在的调脂作用。方法将64只SD雄性大鼠随机分为对照组、造模组、益生组和去污组。采用高糖高脂喂养,亚致
目的了解滨州市人民医院重症监护病房(ICU)常见病原菌种类及分布,并分析其耐药性的变迁,为临床合理应用抗菌药物提供依据。方法对2011年1月1日至2013年12月31日我院ICU住院患
<正>2014年至2015年一季度,中国精铜消费继续低速增长,特别是一季度,明显弱于预期,对于全年消费增幅都有拖累,产量持续保持较高增幅。考虑到宏观面和基本面不确定因素较多,预