论文部分内容阅读
SURPASS是一种增量式的处理数字数据的决策树算法,常被用于入侵检测和模式识别.它在准确率方面超过了一些决策树算法,它的另一个优越性表现在能够处理大小超过计算机内存的数据集.但是由于SURPASS要处理大数据集,它生成决策树耗费的时间比较长.针对这一问题,提出了一种指标并指出了指标的两种形式,使得在SURPASS生成的决策树生长的每一步,可对属性的指标值排序,保留指标值较小的属性,算法从被保留的属性集中选择最佳属性进行分割.这样每一步需要评价的属性的个数减少,或者说在每一步,少量的内存操作可代替大量的外