论文部分内容阅读
为了有效解决因概念漂移造成的数据流分类失败问题,提高数据流分类模型分类准确率和抗概念漂移能力,提出了一种基于信息熵和分类器池的数据流分类模型。利用滑动窗口方法将动态数据流静态化,得到容量相同的数据块;采用信息熵算法对不同数据块之间进行概念漂移检测,当发生概念漂移时对分类模型进行更新,否则继续使用原有分类模型;对于历史出现的概念所对应的分类器,使用分类器池机制对其进行保存,以备后续使用。对多种数据与不同分类模型进行比较,比较结果表明了该模型的有效性。