基于窗口机制的概念漂移数据流分类算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:FXH_590590
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技的快速发展,很多应用领域产生了大量的现实数据。如网络安全、股票分析、电子商务、气象监控等领域。在这些数据中可能隐含着丰富的、有价值的、亟待挖掘的信息,并且人们对这些信息的需求也变得越来越迫切,这无形中都推动了数据流研究的快速发展。数据流中的数据普遍具有快速性、连续性、多变化和无限性等特点,且概念漂移现象常常出现。这使得建立在原始数据集上的模型不再适应,从而给传统分类问题提出了极大的挑战。为此,本文针对概念漂移问题展开了一系列的研究,主要工作如下:(1)概述概念漂移数据流处理普遍存在的问题,分析已有算法在处理概念漂移问题时存在的优缺点。(2)数据流的快速性等特性对模型的时空性能有更高的要求。针对此问题,研究并提出了一种基于单窗口的概念漂移数据流分类算法SWCDS。该算法采用随机森林作为基础模型,使用滑动窗口机制检测概念漂移,并根据检测结果动态地调整分类器模型使其更适应新概念数据。实验表明:与已有的代表性的概念漂移数据流分类算法相比,该算法在保证时空性能的同时具有较优的分类精度和抗燥性。(3)单窗口机制中窗口值较大有利于低漂移率的数据流处理,却不适应新的目标函数;窗口值较小能快速地适应概念漂移,却常常由于实例不足导致学习不充分。针对此问题,设计并提出了一种基于双层窗口的概念漂移数据流分类算法DWCDS。该算法采用SWCDS算法中的随机森林作为基础模型,利用双层窗口机制周期性地检测滑动窗口中流数据分布的变化,并动态地更新模型以适应概念漂移。实验表明:双层窗口机制比单窗口具有更优的漂移检测能力。(4)基于以上工作,设计并实现了概念漂移数据流分类系统DWCDS,该系统集成了SWCDS与DWCDS两种算法,为概念漂移数据流分类提供了一个实验平台。
其他文献
多视角视频拼接被广泛应用于视频监控、视频会议、卫星遥感等领域,它可以在保证高分辨率的情况下扩大视频视角,一直是计算机视觉领域的研究热点。多视角视频拼接的关键是视频
现实社会中存在着各种具有特定功能的系统,例如电子商务系统、科学著作系统、在线社交系统等,这些系统可被抽象为具有复杂内部结构的网络,称为复杂网络。很多研究表明,复杂网
在我国,化肥的施用存在利用率低、环境污染严重等问题。为了解决这些问题,必须进行精准变量施肥。国内外在变量施肥控制系统的研究方面有很多成果和进展。国外的成型系统尽管
学位
事件是指在某个特定的时间和环境下发生的,由若干角色参与,表现出若干动作特征的客观事实。事件抽取任务要求从含有事件信息的非结构化自由文本中,自动识别和抽取出包含有事
云计算(Cloud Computing)是一种服务按需交付的新兴模式,它将大量计算、存储、网络等资源池化,使各种应用系统能够根据需求获取各种资源和服务。而网络视频作为一种技术成熟、
随着无线传感器网络的不断发展,其应用范围涵盖军事安全、工业监控、环境监测与保护、医疗监护、智能家居、交通控制、精细农业等诸多领域。例如在基于无线传感网的高压输电
数字图像抠图技术是指把指定的前景从已有的自然图像中分离出来的一种技术。它最早被运用于影视业的特效制作中,为影视业赢得了巨大的商业价值。如今,抠图技术已经随着科技的
随着虚拟现实与计算机技术的不断发展,虚拟手术在医疗卫生领域发挥的作用越来越大,不仅可用于手术技能培训,还可用于手术规划、手术预演、手术导航等。在虚拟手术中,软组织形
随着计算机网络的普及,企业信息化程度不断提高,人们对信息化服务的要求越来越高。在这个信息膨胀的时代,各种电子文本数据急剧增加,占据了网络资源的大部分空间,对于这些文本数据