基于数据挖掘的文本分类算法

来源 :长春师范大学学报 | 被引量 : 0次 | 上传用户:suhuisu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是网络数据管理研究中的难点,本文运用支持向量机非线性分类能力和协同进化粒子群算法全局搜索能力,提出一种基于数据挖掘的文本分类算法。首先对网络文本样本进行相关预处理,提取文本的特征向量,然后将训练样本输入到支持量机进行训练,采用协同进化粒子群优化算法优化分类器参数,最后采用Reuters21578数据集对模型性能进行分析。研究结果表明,运用协同进化粒子群算法可以快速找到支持向量机的最优参数,提高文本分类的正确率,分类速度可以满足文本分类在线应用要求。
其他文献
分段函数是高等数学中一种重要的函数,该文讨论了分段函数分段点处的可导性,并给出了求分段函数分段点处导数的几种方法。
随着我国民航事业的发展,航空安全问题越来越受关注,航线与交通流量的增多,对空中交通管制服务的要求也越来越高。在空中交通管制安全预警管理中,为了提高预警信号的输出精度
【摘 要】高中物理力学学习难度大,掌握一定的学习技巧和方法至关重要。本文通过笔者的自身体会,提出了加强概念理解、合理受力分析、掌握公式运用等基本方法,旨在为同学们学习力学知识提供一定帮助。  【关键词】高中物理;力学;学习方法及技巧  【中图分类号】G633.7 【文献标识码】A  【文章编号】2095-3089(2018)33-0044-01  高中阶段课程多、任务重,特别是物理课程,既有抽象的
摘 要:针对目前《控制工程基础》在教学方面存在的问题,从满足培养应用型工程技术人才的需要出发,该文在教学内容、教学方式、实验内容、信息反馈平台以及考核方式等方面,对《控制工程基础》课程的教学改革实践内容作了详细介绍。  关键词:控制工程基础 教学改革 实践  中图分类号:G420 文献标识码:A 文章编号:1674-098X(2013)03(c)-0-02  《控制工程基础》是该校测控技术与仪器、
【摘要】 作文讲评课的质量则是促进作文教学的关键。有针对性、解决实际问题的讲评,对学生作文水平的提高有很大的推动作用。本文探讨的是如何通过丰富多彩的作文课堂教学的最优化,使学生有一个和谐主动的发展,真正实现学生探索、创新能力等综合素质的全方位提升。  【关键词】作文讲评 课堂效益 体会  【中图分类号】G623.2 【文献标识码】A 【文章编号】2095-3089(2018)30-0249-02 
随着矿山生产规模的不断扩大,使得大量的矿山机械设备被应用到矿山的实际运转当中。由于矿山开采机械化程度越来越高,使得对矿山设备的保养和维修的要求也越发严格。该文主要总
《水文资料整编规范》与《水文测验规范》是保证水文资料成果质量的重要规范性文件。但是为了保证水文资料具有良好的可靠性、完整性以及精确性,还需要依据水文资料成果的规
无论做任何工作首先要做人,教师则更应修身养性。多年前,我在自己的日志中这样写道:也许是因为自己年龄不大,经历尚浅,到目前也只知道做人要正直、善良、宽容……,我也只能努
姚五沟花岗斑岩呈小岩株产于内蒙古太仆寺旗境内,前人对其研究较少。本文研究了它的地球化学特征,结果表明其主要矿物成分为石英、钾长石和斜长石,次要矿物为黑云母;SiO2平均值为
目的 探讨经后路椎间盘镜(MED-Ⅱ)手术治疗腰椎间盘突出症的手术技巧.方法 持硬膜外麻醉下,床旁C臂机定位,MED-Ⅱ下行椎板间隙开窗,摘除突出椎间盘髓核组织.结果 MED-Ⅱ手术共