论文部分内容阅读
近年来,基于关联规则的文本分类方法受到普遍关注.虽然在一般情况下这种方法可获得较好的分类效果.但当样本特征词分布明显不均时,分类规则在各类别的分布也出现不均,从而导致分类准确率下降.本文设计和实现的基于规则权重调整的关联规则文本分类算法可有效地解决这一问题.该算法根据误分类训练样本的数量定义规则强度.对强规则通过乘以小于1的调整因子降低其权重,而弱规则乘以大于1的调整因子提高其权重.实验结果表明经过规则权重的调整,分类质量显著提高.