论文部分内容阅读
如何快速地整理海量信息 ,对不同的文本进行有效分类 ,已成为获取有价值信息的瓶颈。本文提出的中文文本分类方法 ,较好地解决了信息的实时分类问题 ,在实践中收到了良好的效果。由于汉语文本的特殊性 ,在分类器训练前对训练文本进行自动分词和降维预处理。许多文本往往可能归到多个类 ,因此分类算法采用模糊c -原型算法。实验表明 ,该方法综合效果较好 ,可以实现文本的快速分类。