论文部分内容阅读
这篇论文为文章分类基于在特征之间的独立措施建议特征选择的一条新途径。在文件的术语的出现独立于对方的一个基本假设,广泛地为文章分类(TC ) 在概率的模型使用,被讨论。然而,基本假设为特征集合的独立是不完全的。从特征选择的看法,在特征之间的一项新独立措施被设计,由哪个一个特征选择算法被给获得一个特征子集。选择子集在有范畴的关联高;在在特征之间的独立强壮,在最大的度满足基本假设。与在 TC 的另外的传统的特征选择方法相比(它仅仅被拿进关联说明) ,我们的方法选择的特征子集的性能在有 20 个新闻组的基准数据集