论文部分内容阅读
定义了两种特征影响度:一种是特征对类间文档分散程度的影响度,该影响度越大越好;另一种是特征对类内文档分散程度的影响度,该影响度越小越好.然后把这两种特征影响度有机地结合起来设计了一个新的特征选择方法.该方法能够对所选特征进行综合考虑,从而使获得的特征集具有较好的代表性.仿真实验表明,所提特征选择方法在一定程度上能够提高文本分类性能.