K-means聚类和支持向量机结合的文本分类研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:hmglz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对数据挖掘中文本自动分类问题,提出了一种基于k-means聚类算法和支持向量机相结合的文本分类方法。该方法先将文本大致聚为k类,然后对每一类用支持向量机进行细分。构造了可用于多个模式类识别的多层SVM模型,该模型可完成对多个模式的分类识别。给出了该模型的构造及应用的方法,并验证了该方法的有效性。
其他文献
以问题为本的学习是以问题为起点,通过学习者合作解决问题,从而获得知识与发展能力的学习.学习的途径与方式是小组自主合作,学习的结果是建构知识、形成技能、发展能力.本文
构造了3种带参数的三角样条基,基于这3组基定义了3种三角样条曲线。与二次B样条曲线类似,这3种曲线的每一段都由相继的3个控制顶点生成,且这3种曲线具有许多与二次B样条曲线
指代消解是自然语言处理中语篇理解的关键问题之一。近年来对于树核函数的研究为指代消解提出了新的思路。基于树核函数,提出了一种新的中文代词的消解方法。将句法树作为一
英语词语的意义由其所处的语境来决定,尤其是不同的学科有其独特的意义.译者在翻译时须予以重视,认真揣摩原文的语境,正确选取语义.同时,译者对所译学科的术语有所掌握或了解
用多指标综合评价法评价12个厂家生产的三七片的质量。采用热浸法、紫外分光光度法和高效液相色谱法,分别测定各厂家三七片的醇浸出物、总皂苷、人参皂苷Rg1、人参皂苷Rb1和三
综述了无溶剂绝缘浸渍硅树脂的制备、应用及研究进展,认为目前中国在该领域存在的问题主要是制备原料的纯度达不到要求、尚无稳定的催化剂体系、浸渍硅树脂的应力稳定性较差
<正> 内燃机车在实际运行中,经常出现接地故障,它在所有故障中发生率最高,且不易查找,判断。该故障如果处理不及时,会直接影响到安全行车,轻则在区间内运缓,重则造成机破事故
利用单向S-粗集对偶(dual of singular rough sets),给出知识堆垒及其生成的知识垛的概念,知识垛具有动态特性;给出粗知识垛的生成,提出粗知识垛生成原理及粗知识垛的还原定理,提出
<正> 本文所指的影视教学法,是指运用录像、电影等影视媒体为课堂教学必要手段的方法。按影视手段介入教学的时间区间划分,可归纳为课前预习式、课后复习式、系统播放式和课
烟标在销往香烟生产企业之前,需要对其进行计数。设计了一种基于机器视觉的烟标计数装置。采用特制扫描仪,将成叠的烟标侧面转换成图像信号,传送给专用的图像处理系统;图像系统通