【摘 要】
:
由于支持向量机在处理高维小样本数据时的识别精度显著优于传统机器学习方法,因此支持向量机的多分类编码方法与应用研究是近年来多分类研究的热点。但是由于采用SVM进行多分
论文部分内容阅读
由于支持向量机在处理高维小样本数据时的识别精度显著优于传统机器学习方法,因此支持向量机的多分类编码方法与应用研究是近年来多分类研究的热点。但是由于采用SVM进行多分类时必须将SVM的二分类扩展至多分类,易出现决策盲区、数据集倾斜,Consistent-diverse等问题,从而导致最终决策产生偏差甚至是错误的情况,因此,本课题拟舍弃现有的lvs1、IvssA、ECOC等思想,通过一种全新的思路和视角来构建基于SVM的多分类模型以解决上述问题。本论文的主要研究工作包含:设计了一种获取样本集线性可分情况的简单有效的方法,并在此基础上,提出了一种基于支持向量机的多分类模型的构造方法,旨在优化支持向量机的多分类效果和效率,弥补上述算法的不足;以BreastTissue数据集为例进行方法解释,完成对应的算法设计和编码实现;运用不同的数据集(Iris、BreastTissue、Statlog(Image Segment)),对本文提出的支持向量机多分类方法进行效果验证,对比其他多分类算法,验证分类模型的正确性和有效性;最后,总结了课题研究工作,并对下一步的研究工作进行了展望。
其他文献
随着互联网的发展,数据呈现几何式的增长,如何能够从巨大的数据中快速寻找出对自己有用的数据,将会是大家面临的一个问题。搜索技术的出现方便了人们快速而且有效的获取信息
现代数字信号处理器(DSP)一般采取超长指令字或是超标量来实现指令级并行。超长指令字(VLIW)数字信号处理器将并行任务的识别和调度交给了编译器,因此在利用VLIW DSP的时候需
在通信技术迅速发展的今天,手机已经成为人们工作和生活当中不可或缺的联系工具。手机给人们带来众多便利的同时,也常常被不法分子利用作为犯罪工具,司法机关急需采取有效的技术
生物医学文献数量的急剧增加,使得生物医学从业者在海量生物医学文献中快速地获取大量的感兴趣的信息变得困难。因此,快速有效地从海量无结构化的文本中抽取出便于管理、查询
MicroRNA (miRNA)是一种非编码的RNA序列,这些长度约为21个碱基的序列在动物、植物、病毒基因的后转录过程中发挥着巨大的作用。MiRNA可以靶向到它们对应的靶基因,抑制某些基
信息时代,高速发展的计算机技术使许多有价值的信息被保存起来,但是如何将这些隐含信息有效地挖掘出来加以利用是我们不断研究的方向。关联分类作为数据挖掘中一种分类精度高,适
随着我国经济的发展,城镇人口增多,步行交通量随之增大,但很多交叉口的信号配时控制并不完善,不能合理地同时满足机动车和行人的通行效率,导致交叉口交通秩序混乱、安全隐患增加,严
在经济全球化的浪潮推动下,企业之间的业务协作逐渐频繁和复杂。作为对企业运转和管理来说必不可少的支撑系统,各个企业的应用软件之间也必须能够互通互联,以支持企业之间的
随着高科技的引入和全球化的发展,我国高等教育实现了不断跳跃的大发展,已挤身于教育大国的我们正往教育强国的目标努力。但高等教育发展时间较短、准备不充分的特点使其落后
近年来,随着研究生教育规模的不断扩大,申请学位的人数和类型不断增加,每年毕业的研究生数量不断增长,学位管理面临的压力越来越大。面对众多的毕业生,如何高效合理地完成复