论文部分内容阅读
本文描述了线性可分与线性不可分支持向量机以及支持向量机如何利用核方法来解决非线性问题。同时,还讨论了支持向量机的训练算法以及惩罚参数不对称的支持向量机。由于支持向量机最初是被设计为二类问题模式分类方法,本文详细比较了文献中常用的几种多类支持向量机方法。
接下来重点介绍了最小最大模块化支持向量机的基本思想,详细说明了最小最大模块化支持向量机的任务分解方法和模块集成规则,并着重分析了最小最大模块化支持向量机的串行与并行训练时间复杂度。
最后,把最小最大模块支持向量机应用到大规模的文本分类问题。简要介绍了文本分类系统的主要组成部分。在IBM p690 机器上实现最小最大模块化支持向量机,并对《读卖新闻》数据集进行仿真实验,研究了《读卖新闻》数据集的训练时间与训练样本个数的关系,比较了最小最大模块支持向量机与传统支持向量机。最后对文本分类中的多标号问题进行了讨论。文本分类实验结果表明最小最大模块化支持向量机在训练时间上的优越性。