基于SVM算法的文本分类器的实现

被引量 : 0次 | 上传用户:q28100125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machine,SVM)是一种新型机器学习方法,它是以统计学习理论为基础,较好地解决了非线性、高维数、局部小样本等实际问题。文本分类是基于内容的自动信息管理的核心技术。文本向量的最大特点是稀疏性大和维数高,支持向量机对于处理高维数的问题具有较大的优势。因此,支持向量机非常适用于文本分类问题,在文本分类中具有很大的应用潜力。由于支持向量机具有全局最优、结构简单、推广能力强等优点,近几年成为机器学习领域的研究热点并且广泛应用于文本分类等领域。本文简单介绍了文本分类的发展、研究现状、以及文本分类的过程。并在此基础上对SVM算法的理论进行了深入的研究,同时在该算法的基础上研究了基于SVM算法的文本分类系统,并对系统结构和运行结果进行了简单的分析。
其他文献
文章介绍了电影领域有关身份和性别学研究的最新角度,指出酷儿的特质是游移的身份、流动的欲望,其核心意义在于继承并发扬了女性主义、黑人运动、民族解放运动,男女同性恋运
土默川平原,孕育出了丰富的文化、旅游样态。包头市作为土默特平原上的一颗明珠,在充分发挥既有文旅资源的基础上,不断开拓创新,文旅产业进一步细分,文旅业态更加丰富,创意创
近年来,高效节能的新型焊接方法成为国际焊接领域研究的热门课题之一。目前对活性焊接方法的研究表明,对于碳钢、不锈钢等钢材而言,活性元素氧可改变钢材熔池表面张力温度系
王建中创作的《如梦令》《声声慢》是以李清照的词谱曲的现代作曲技法的艺术歌曲。文章将对这两首歌的词曲创作及演绎风格进行分析。正是基于中国现代作曲技法的艺术歌曲在新
目的:探讨中年及老年复发脑梗死的病因分布和其危险因素。方法:回顾性分析复发和初发脑梗死患者218例(年龄>45岁),经影像学和临床体征及其他病因学检查确定诊断的临床资料,依据
文本分类是指按照预先定义的主题类别,为文本集合中的每个文本确定一个类别。随着文本信息数量的快速增长,特别是互联网上海量文本信息的产生,自动文本分类技术已经成为组织
测量不确定度是与测量结果相关联的参数,表征合理赋予的被测量之值的分散性。测量结果的质量如何,在很大程度上取决于其不确定度的大小。在对产品质量进行检测时,给出测量结
<正> 香叶生产于中国,埃及、摩洛哥、留尼汪、阿尔及利亚、印度、法国、苏联等国家和地区。用作香料的主要品种有玫瑰香叶(Pelargonium rosum)、香叶天竺葵(P.graveolens)、
研究开发物资管理系统,对加快全州中小企业物资的周转速度、提高生产效率、提升物资管理水平、为企业的管理和决策提供科学的依据、增强企业的竞争力都具有现实意义和应用价
<正>最近有几件事情促使我思考出版科研如何"接地气"的问题。一是国庆节期间和几位新闻出版界的朋友相聚。一位出版社的社长朋友讲道:他们出版社的收入板块里面,非出版收入已