论文部分内容阅读
提出了一种基于散度差的组合型文本特征抽取方法.首先讨论了文本分类中特征降维的主要方法及其特点,然后分析了基于散度差的准则的特征降维的原理和方法,在避开求逆矩阵问题的同时,通过对文本特征进行选择对文本特征集进行了第一次压缩,借助于加权散度差原理对特征集进行了二次抽取,在最低限度减少信息损失的前提下实现了特征维数的大幅度降低.实验结果表明,该方法在文本分类上的效率较好.