论文部分内容阅读
传统的基于向量空间的文本分类方法很难处理文本的高维特性,本文首先综述了潜在语义分析的理论及方法,并且解释其数学意义,提出基于潜在语义分析的Web文本分类方法,给出Web文本的特征表示,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间.在潜在语义空间中利用支持向量机方法实现文本分类.最后采用两种文本分类方法进行对比实验,实验表明基于潜在语义分析的方法比传统方法取得更好的文本分类效果.