论文部分内容阅读
提出一种改进的SLIQ决策树分类算法.克服原有SLIQ算法需要大量计算决策树每个节点的吉尼指数(GINI Index)的缺点。一是给出数据分布密度的基本概念。并在GINI指标的基础上利用数据分布密度差改进SLIQ;二是将SLIQ算法应用到综合评价中去。实例结果表明,算法改进后,寻找最佳分裂方案的GINI指标的个数大大减少,缩减计算量,降低排序成本和寻找最佳分裂点的代价,简化决策树的规模。