论文部分内容阅读
David Lee从心理学的角度提出Lee模型并将其用于文本分类。该文将Lee模型引入Nafve Bayes和TFIDF中,比较了影响度和TF-IDF两种不同的文档表示方法对分类精度的影响,并对Lee模型的不同因素对算法的影响效果作了分析。结果表明影响度的文档表示方法比TF-IDF更好一些,启发式的部分读取策略能以较小的时间代价极大地改善分类算法的精度。