论文部分内容阅读
本文从Web文本自动分类的需求出发,针对基于VSM(vectorspacemodel)模型的分类处理中词的无关性假设及词的维数过高等问题,结合Hownet,提出一种基于语义概念的中文文本分类方法.通过语义概念分析可以达到对传统词特征向量的排歧和降维,并在此基础上对文本进行分类处理.本文提出并实现一个基于SVM(supporrvectormachines)中文文本分类的原型系统,对中等规模的文本语料库的实验表明,本系统是有效的.