基于信息熵的动态数据流分类模型

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:xuhaoumsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了有效解决因概念漂移造成的数据流分类失败问题,提高数据流分类模型分类准确率和抗概念漂移能力,提出了一种基于信息熵和分类器池的数据流分类模型。利用滑动窗口方法将动态数据流静态化,得到容量相同的数据块;采用信息熵算法对不同数据块之间进行概念漂移检测,当发生概念漂移时对分类模型进行更新,否则继续使用原有分类模型;对于历史出现的概念所对应的分类器,使用分类器池机制对其进行保存,以备后续使用。对多种数据与不同分类模型进行比较,比较结果表明了该模型的有效性。
其他文献
马克思主义社会哲学研究视域,就是基于历史唯物主义的立场和观点,采用逻辑的方法,着眼于对整个社会结构体系从本体论和认识论层面进行研究。五大发展理念是一个有机整体,各个
目的研究骨髓增殖性肿瘤(MPN)患者外周血单个核细胞JAK2-V617F基因突变与血栓事件发生的相关性。方法对391例MPN患者进行血栓事件调查,同时采用实时荧光定量聚合酶链反应(QRT
为了解决铁路运输管理中车辆分布的可视化问题,提出了一个分布式铁路车辆分布组件的概念,详细地给出了这个组件的基本结构、分析、设计和实现。应用该组件可以为铁路运输管理系
为提高新型电源装置的稳定性、实时性和人机交互能力,通过对电源监控需求进行分析,提出了一种三层集散监控结构,设计并实现了基于ARM的电源嵌入式监控系统。基于Linux和Qt开发平
为了检测特定配置条件下的软件漏洞,提出了一种配置模糊测试方法。它通过改变被测程序的配置检测一些只在特定运行时特定配置下才能表现出来的软件漏洞。应用程序运行在部署环
针对传统VSM(vector space model)在短文本分类中维数高、语义特征不明显的问题,提出基于LDA(latent Dirichlet allocation)模型主题分布相似度分类方法;针对短文本内容少、长度
目的基于中国疾病预防控制中心慢性非传染病疾病预防控制中心"慢病大数据研究(宜昌)基地"信息平台数据,了解湖北省枝江市具备肺结核诊断能力的医疗机构肺结核登记报告工作质
我国五大淡水湖之一的巢湖完整地划归合肥市管辖,为合肥旅游业大格局构建创造了前所未有的机遇和动力空间,新合肥步入环巢湖时代。环巢湖地区有着丰富的文化资源,在合肥"大湖
<增广贤文>里有两句话流传甚广,一句是"逢人只说三分话,未可全抛一片心",一句是"是非只为多开口,烦恼皆因强出头".
目的分析探讨不同受力部位所致颅脑损伤的损伤程度和认知障碍情况的差异。方法收集自2012-03—2014-04间佛山市南海区第五人民医院神经外科收治的外伤所致颅脑损伤患者73例,