聚类加权和CS-LSSVM的文本分类

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:shaoshao137
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本特征提取和分类器优化是文本分类的两个关键问题,为了提高文本分类正确率,提出一种聚类加权(CW)和布谷乌(CS)算法优化最小二乘支持向量机(LSSVM)的文本分类模型。采用TF—IDF算法计算特征词的权重,根据特征词的位置进行加权,经过特征聚类处理降低特征冗余度,采用LSSVM建立文本分类器,采用CS算法对LSSVM参数进行优化。采用复旦大学语料库对模型性能进行仿真测试,仿真结果表明,模型不仅提高了丈本分类的正确率,而且提高了丈本分类的效率。
其他文献
今天,本刊第二期宗教学研究专栏和读者见面了。
李良玉教授指导博士论文,倾尽全力,独具匠心。在选题上新颖独到,在史料上下硬工夫,提倡多学科解读与应用,令人耳目一新。
【正】 ~~
【正】 最近一、二十年发展起来的模糊数学理论,打破了形而上学的束缚,既认识到事物的"非此即彼"的明晰性形态,又认识到事物的"亦此亦彼"的过渡性形态,在处理"模糊问题"中得
<正>~~
【正】 北大西洋公约组织(NATO-NorthAtlantic Treaty Organization)简称"北约",总部设在布鲁塞尔,主要机构有部长理事会、军事委员会。北约除纯军事组织之外,还有大量学术研
【正】 时间不仅是个概念,而且是过程。时间问题,早就引起图书馆学家的注意。比如,印度著名图书馆学家阮冈纳赞所提出的"图书馆五原则"中就有"节约读者时间"这一条,到今天为
目的:探讨检测血清GGT、GGT/ALT以及AFP对肝脏良恶性疾病的临床价值.方法:采用全自动生化仪检测114例肝脏良、恶性疾病患者GGT、ALT活性,采用酶标仪检测AFP活性.结果:原发性
对于多变量预测问题,构造了粗糙集和灰色理论的融合预测模型。该模型运用粗糙集的知识依赖度理论对多属性进行约简,在约简基础上建立GM(1,N)模型。用所建模型对西安市年供水量进行
针对目前太阳能发电系统发电效率低的问题,设计制作了基于STC89C52的太阳能最大功率点跟踪控制系统;系统采用光电检测跟踪的控制方式,以步进电机作为驱动机构,通过控制跟踪机构水