论文部分内容阅读
与其他分类技术相比较,ID3算法具有耗时少、速度快特点.然而,ID3算法分类规则少、无匹配率高,从而导致其分类准确率不高,尤其在小数据集上表现更为明显.针对ID3上述缺点,我们提出了一个改进ID3算法VRID3:首先,VRID3创建一个虚根节点,然后找出两个"最好"属性生成虚根节点的两棵子树,从而提高测试实例的匹配率;其次,测试实例时,优先使用第一子树判断实例,如果第一子树没有匹配到,则使用第二子树判断该实例.实验结果表明,基于虚根节点的ID3算法具有更高的准确率.