论文部分内容阅读
决策树是数据挖掘分类方法中一个重要分支,广泛应用于各行业的客户关系管理系统中。介绍了决策树算法中的经典算法C4.5,该算法在对连续属性进行离散化处理时寻找最佳分割点比较耗时,结合Fayyad连续属性的最佳分割点总分布在边界点处的原理,对C4.5算法中的连续属性离散化过程进行了一些改进,改进的C4.5算法在构造决策树时与原C4.5算法相比具有相同的分类准确率和更高的计算速度。