基于Weka平台的文本分类实验研究

来源 :楚雄师范学院学报 | 被引量 : 0次 | 上传用户:xrong19730911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类的分类算法常用J48算法、Naive Bayes Multinomia算法和SMO算法,利用Weka平台选择路透社的数据集进行分类实验,根据查准率、查全率和F-Measure综合指标结合其他文本分类评价指标分析六次实验得到的结果,得出SMO算法优于其他两个算法。针对选择的Naive Bayes Multinomia算法,调整了numToSelect值,对其结果进行了优化。以此实验为文本分类研究工作提供参考。
其他文献
引子窗台上那一缸水,透着清冽。几尾金鱼游曳其间,静如处子,方显岁月悠然。进屋,暖气正热,20余度,室内室外,天差地别。室内之鱼,因温度稳定,或顾竞相乞食,或漫无目标游荡,不
在经济快速发展的今天,公路桥梁的建设范围和工程量,具有直线上升的态势,给很多地方的社会发展,都提供了较多的支持。从客观的角度来分析,公路桥梁的建设难度较高,必须考虑很
期刊
高体积分数金刚石颗粒增强Cu基复合材料由于硬度高导致其难以加工成形。采用粉末注射成形制备多孔金刚石预成形坯和Cu熔渗相结合的工艺可以实现金刚石/Cu的近净成形。本文对经
在动物界,和人类最接近的物种要数黑猩猩、大猩猩和猩猩了。其中,黑猩猩和人在基因结构上的相似程度竟达到96%以上。对于这三种类人猿的研究和保护自然成了世人瞩目的重大课
鞭打锈球及其种子胶质开发利用朱向秋魏建梅茆振川(河北农林科学院昌黎果树研究所,昌黎066600)鞭打绣球(Nicandraphysaloides(L.)Gaertn.系茄科一年生草本植物,原产南美,现在我国广泛分布于西南、西北和华中、华北的部分
1999年,世纪之交年。这一年,澳门回归,共和国五十岁,世人将奔向21世纪。在全球经济大多不景气的情况下,中国经济在这重要年头将何去何从?请听专家们的分析、预测。
"化石"是在远古地层里发现的,当然与地质学紧密相关。汉语中的"地质"一词最早出现在三国时期王弼对《易·坤》的注释"居中得正,极於地质,任其自然而物自生"。1853年-1854
铁路作为国民经济大动脉,是我国现代物流体系建设与发展的重要组成部分。随着我国物流行业的迅速发展,传统的铁路货运已难以满足现代物流发展的需要。铁路系统企业必须明确目
军工房地产与一般房地产相比具有一定的特殊性,由于其用途的特殊性又给房地产评估工作增加了困难。随着我国各地城镇化进程的不断推进,军工项目所在区域也由原来的偏远郊区变