论文部分内容阅读
随机森林是一种优秀的集成学习算法,能很好地避免过拟合现象的发生。然而随机森林算法的时间复杂度通常较高,影响了该算法的广泛应用。针对这种不足,本文提出了一种基于K均值算法的随机森林快速学习算法,该算法首先利用经典的K均值算法对每一类原始样本进行聚类,然后对每一簇求样本中心,用样本中心作为新的样本点替换该类别的原始样本。然后利用随机森林对新构造的数据集合进行学习。在网络入侵检测数据集上的实验充分验证了本文算法较传统的随机森林算法具有更快的分类速度。