基于支持向量机的多类文本分类研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:hangxujie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机信息技术的高速发展,英特网上的电子文档信息急剧增加,如何对大量文本信息进行挖掘,尤其是按照预先定义好的语义对它们进行正确的类别判断,已经成为组织管理大量文本信息的一个重要问题,它就是文本挖掘中很关键的一类任务——文本分类。支持向量机(Support Vector Machine,SVM)是由Vapnik等人在上世纪九十年代提出的一种建立在统计学习理论基础之上的模式识别方法,是借助于最优化方法解决机器学习问题的新工具。SVM集成了稀疏解、最大间隔超平面、松弛变量、Mercer核和凸二次规划等技术。由于支持向量机具有结构简单、全局最优、推广能力强等优点,最近几年在模式识别以及文本分类等领域得到了广泛的研究与应用。但是SVM最早是针对两类分类问题提出的,如何有效的将标准两类SVM分类问题扩展到多类分类问题并应用于多类文本分类是本文研究的重点。本文在对文本挖掘的相关概念、过程以及方法等问题进行阐述的基础上,对目前具有代表性的SVM多类分类方法进行了深入的研究以及优缺点对比后,提出了一种改进的决策导向无环图支持向量机多类分类算法,并把改进后的决策导向无环图支持向量机用于多类文本分类。本文的主要研究工作以及创新点在于:①阐述了文本挖掘的理论与技术,并重点研究了文本分类,着重对支持向量机分类算法进行了基本理论以及算法原理上的阐述,并对SVM应用于分类挖掘时的主要研究进展做了分析,由此引出SVM多类别分类算法的研究,然后介绍了目前存在的基于SVM的多类别分类方法,包括“一对一”、决策导向无环图支持向量机方法、“一对多”、M-ary支持向量机、基于二叉树的SVM多类分类等,分析了它们的性能并比较了它们的优缺点。②着重研究了决策导向无环图的多类SVM分类算法,在目前决策导向无环图支持向量机分类器生成顺序随机化的基础上,提出了一种决策导向无环图的改进策略,引入类内的分散度,以基于样本分布的类间不可分离程度作为类别的划分顺序,最终构成了一种分类间隔较大的决策导向非循环图支持向量机分类算法。③在标准UCI多类数据集上,通过数值实验对改进后的决策导向无环图支持向量机方法与改进前的决策导向无环图支持向量机算法的分类效果进行比较,实验结果表明本文的方法具有更高的准确率。
其他文献
当轨道车辆以较高速度运行时,转向架在横向可能产生一种周期性大振幅的摇摆运动,即蛇形振动。剧烈的蛇形振动会增大车轮脱轨的危险性,从而威胁到车辆运行的安全性。抗蛇形减振器能有效地抑制转向架的蛇形振动,从而保证轨道车辆在低于蛇形临界速度下安全地运行。目前轨道车辆抗蛇形减振器大部分都是筒式油压减振器。油压减振器属于不可变参数减振器,只能在特定的工况下才能达到最优,因此油压抗蛇形减振器缺少对变载荷、变车速以
“微小卫星编队飞行模拟仿真系统”通过气浮平台与气足模拟卫星微干扰在轨运动,并利用3套以上微小卫星模拟器进行编队飞行关键技术的地面仿真验证,是进行卫星编队系统技术研
地球模拟器是在地面上标定卫星敏感器精度的试验设备,通过调节热地球的温度,也就是红外辐射量,用光学调制器将热地球圆盘红外恒值辐射量改变为正弦辐射量,使红外地球敏感器输
超声相控阵技术是近年来无损检测领域的研究热点。通过对超声阵列换能器中各个阵元施加独立的相位控制,可实现声束的偏转和聚焦。它可以灵活地采用多种扫描方式进行检测,检测
随着虚拟现实技术的发展,人机交互性作为其特性之一,逐渐成为虚拟现实技术研究中的一大热点。数据手套是虚拟现实技术中重要的外部设备,虚拟手的设计和实现是应用数据手套的
作为热泵空调设备的重要组成部件,四通换向阀一直采用人工手动的方式进行焊接装配,随着近几年空调的普及使用,传统制造工艺中员工劳动强度大,生产效率低等问题逐渐显现,难以满足逐年上涨的消费需求,虽也有企业采用国外的四通阀专机设备,但还是存在着工作环境恶劣,成本昂贵,焊接质量不稳定等缺点。为了实现对四通阀工件的自动化钎焊装配,提高焊接的效率以及质量,提出了一种基于结构光的四通换向阀空间定位方法。通过计算机
气缸作为气动系统中最普遍的执行元件,其优良的气密性能,不仅是满足自动化设备使用要求的关键,同样在企业的节能、保障生产安全等方面发挥重要作用。随着对气缸产品质量要求的提
随着经济社会的快速发展,迫切需要创新地籍测量技术,以满足地籍调查工作的需要。为此,本课题组设计了用于地籍图根点测量的GPS/SINS组合厘米级定位系统。本文主要对该系统设备
无人直升机可远程遥控或程序控制飞行,整个飞行控制系统由地面站、机载系统和信息传输系统三大部分组成。地面站发送的任务指令,通过无线链路/无线网络将其传送到机载计算机
随着科学技术的发展,智能复合材料作为一种新型材料,在各个高科技领域,特别是航空航天工业中,展示了广阔的应用前景。所谓智能复合材料就是将传感元件以及驱动元件与先进的复