基于交叠数据窗距离测度概念漂移检测新方法

来源 :计算机应用 | 被引量 : 5次 | 上传用户:shirley09liu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对数据流中的概念漂移检测存在错误检测、延迟检测等问题,提出了一种基于交叠数据窗距离测度的在线概念漂移检测方法。通过将数据流划分成大小相等且交叠的数据窗并计算相邻交叠数据窗异构欧氏距离,同时利用近邻原则判别数据窗中样本不一致程度,从而实现分布差异性评价和漂移的检测。为评价该方法的有效性,在具有不同漂移严重程度和漂移速度的公开数据集上进行了实验,实验结果表明:该方法能够准确快速地检测到不同类型的概念漂移且能够找出概念漂移发生的具体位置。
其他文献
在日常生活中,除了正常工作,不论是领导干部还是平民百姓,每个人都有点自己的业余爱好。唱歌跳舞、吟诗作文、琴棋书画、藏古赏今等等,形形色色,各有特点。
《上海市中长期教育改革和发展规划纲要(2010-2020)》指出:高中教育要"为每个学生的成长、成人、成功奠定基础,形成‘高质量、多样化、有特色、可选择’的发展格局",将"建设若干个
文章介绍株洲冶炼厂能源消耗在生产成本中的构成状况,并分析了能源消耗高的各种因素。
分析四端进电160kA预焙槽母线结构特点,结合平果铝一期电解系列母线预通电接点压降测试的实际,提出处理接点施工质量、降低电压以及改进联接方式(加焊板)的方法。
针对现有多变量时间序列分类算法存在的要求序列等长和忽视类别信息两个不足,提出基于奇异值分解(SVD)和判别局部保持投影的分类算法。该算法基于降维思想,先通过SVD将样本的第一右奇异向量作为特征向量,以此将不等长序列转化为规模大小相同的序列;接着采用基于最大间距准则的判别局部保持投影对特征向量投影,充分利用类别信息以确保投影后同类样本尽量接近,异类样本尽量分散;最后在低维子空间采用1最近邻(1NN)
为缩短网格中数据并行流水线在吞吐率受限下的延迟,提出了一种优化任务指派的算法.在一个流水线中,每个任务都可以是一个数据并行程序.当多个任务被指派到同一个并行系统时,
海拉尔分局结合铁道部、铁路局会议精神,在对"一体、自主、效益"思想政治工作运行机制"扬弃"的基础上,最终确定了"一体两纳入"的管理机制.这一机制的确立,使我们对思想政治工
关于铁路职工观念更新的若干问题探讨施玉宝“解放思想,更新观念”,是近来人们频繁地使用它来作为推进改革、开创各项工作新局面的首选措施。为什么观念的更新成为推进各项工作
针对智能手机所面临的信息安全威胁问题,提出一种基于手机触摸屏传感器的多点触摸身份认证方法。首先由触摸屏传感器采集手指滑动原始数据序列,通过平滑去噪、位置及长度归一化预处理;然后提取手势运动一阶、二阶归一化导数序列及运动方向为身份验证特征序列;最后采用模板匹配方法,使用动态时间规整算法匹配比较注册模板特征序列与测试特征序列,判断用户身份真实性。仿真结果表明,所提算法对不同用户身份认证的平均错误拒绝率