论文部分内容阅读
针对传统特征降维方法忽略特征项本身的语义信息,提出一种基于潜在语义索引和词聚类的特征降维方法,通过对原始特征词-文档矩阵进行奇异值分解,根据特征词在语义空间中的相似度进行词聚类,在考虑特征词的语义信息的同时实现特征词维度的降低。实验结果表明,基于潜在语义索引和词聚类的中文文本降维方法对文本分类效果有一定的提升。