最小最大模块化支持向量机及其在文本分类中的应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:amexiao428
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文描述了线性可分与线性不可分支持向量机以及支持向量机如何利用核方法来解决非线性问题。同时,还讨论了支持向量机的训练算法以及惩罚参数不对称的支持向量机。由于支持向量机最初是被设计为二类问题模式分类方法,本文详细比较了文献中常用的几种多类支持向量机方法。 接下来重点介绍了最小最大模块化支持向量机的基本思想,详细说明了最小最大模块化支持向量机的任务分解方法和模块集成规则,并着重分析了最小最大模块化支持向量机的串行与并行训练时间复杂度。 最后,把最小最大模块支持向量机应用到大规模的文本分类问题。简要介绍了文本分类系统的主要组成部分。在IBM p690 机器上实现最小最大模块化支持向量机,并对《读卖新闻》数据集进行仿真实验,研究了《读卖新闻》数据集的训练时间与训练样本个数的关系,比较了最小最大模块支持向量机与传统支持向量机。最后对文本分类中的多标号问题进行了讨论。文本分类实验结果表明最小最大模块化支持向量机在训练时间上的优越性。
其他文献
机器人技术是当今世界最前沿的研究领域之一,其中仿人机器人是最具有代表性的智能机器人,因为仿人机器人外观和人类相仿,采用双足行走,相对其他形态的机器人对环境有更好的适应能
随着高校规模的不断扩大和管理信息化的普遍实施,学校的教学和学生管理部门都建立了自己的管理信息系统,而且都积累了大量的业务数据。为了更加充分有效地利用这些管理信息系统
随着计算机科学的快速发展与广泛应用,信息网络技术业已深入到现代教育的众多领域。与此同时,高校信息化建设的步伐也越来越快,学校内各个部门都开发出了自己的应用系统以满足校
网格计算是近几年来出现的新兴技术。建立网格可以最大限度地综合利用分布资源(数据,计算能力,存储能力等),即消除异构资源孤岛,真正实现资源共享。网格(Grid)概念的提出为基
工作流管理系统被用来在异构、分布式应用系统架构内定义和驱动业务流程,它的首要目标是要保证在业务流程的处理过程中,由合适的参与者,在合适的时间、合适的地点,利用合适的
本文对基于粗集的约简和分类方法进行了系统深入地研究。总结了现有方法,并对一些算法进行改进,进而提出了几个新的算法。主要工作如下: 首先给出了可分辨矩阵的概念及基于可
游戏引擎作为一种新的游戏编程模式,在一定程度上提高了游戏开发的效率。游戏引擎中的资源管理是对各种资源进行统一管理并提供统一接口的组织方式,它是游戏引擎中的重要组织
集群通信系统是多个用户共用一组无线电信道,并动态地使用这些信道的专用移动通信系统。MPT1327 是专用信令信道集群移动通信系统的一种公开的典型信令。MPT1327 是一种模拟
由于传统的SPC要求控制特性满足相互独立并服从正态分布等前提条件,造成了SPC的局限性。针对SMT中的一些特殊问题,本文进行了探索,改进了传统的SPC,使之能较好的控制这些特殊的问
信息科学发展到今天,企业对可以在线访问及不断更新的数据的依赖达到了前所未有的程度。不可预计的事件可能会限制数据的访问,严重地影响企业的运营。而且,自然灾害等事件会