论文部分内容阅读
经典ID3算法在构造决策树有偏向于取值多的属性的缺点,主要原因是对概念的分级不够细致到位,造成信息熵的计算不准确,从而导致构造决策树时偏向于取值多的属性.本文提出了有效而简洁的分层概念的信息熵方法,在决策树的构造过程中较好地克服了ID3算法存在的缺点,最后通过一个实例验证了分层概念的信息熵方法的有效性性.