论文部分内容阅读
分析几种常见的特征选择评价函数,将权值计算函数应用于特征选择.提出一种新的基于改进TFIDF的文本特征选择评价函数,即TFIDF—Dac。它从提高特征项的类区分能力角度考虑,将特征项在类间的分布信息引入公式,弥补了传统的TFIDF的不足。实验测试表明,使用改进的特征选择方法能够有效提高文本分类的准确度。