一种挖掘概念漂移数据流的选择性集成算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:jtls
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
摘要提出一种挖掘概念漂移数据流的选择性集成学习算法。该算法根据各基分类器在验证集上的输出结果向量方向与参考向量方向之间的偏离程度,选择参与集成的基分类器。分别在具有突发性和渐进性概念漂移的人造数据集SEA和Hyperplane上进行实验分析。实验结果表明,这种基分类器选择方法大幅度提高了集成算法在处理概念漂移数据流时的分类准确性。使用error-ambiguity分解对算法构建的naive Bayes集成在解决分类问题时的性能进行了分析。实验结果表明,算法成功的主要原因是它能显著降低平均泛化误差。
其他文献
为了表示元组和属性值的逻辑区别,引入了一个双层描述逻辑,其中概念分为两类:元组概念和属性值概念。给出双层描述逻辑的语言、语法和语义;然后定义从数据库中的关系到双层描述逻
提出了一种新的融合分布估计的蚁群优化算法。该算法突破了传统蚁群过早收敛的局限性,且蚁群中的每个蚂蚁具有更全面的学习能力,从而能够有效地解决组合优化问题。仿真实验结果
从系统的角度研究了一种基于ESB的BPM平台NpuESB的设计与实现。在设计符合JBI规范的分布式企业服务总线技术的基础上,提出一种分层体系结构的BPM平台设计方案。研究了设计与实
将处理约束问题的乘子法与改进的粒子群算法相结合,提出了一种求解非线性约束问题的混合粒子群算法。此算法兼顾了粒子群优化算法和乘子法的优点,对迭代过程中出现的不可行粒
存储区域网络是近年来流行的一种基于"块"数据访问的存储解决方案,应用于很多领域。联机事务处理也是目前应用很多的业务,将联机事务处理业务运行在存储区域网络中,能够提高业
无线传感器网络因节点能力的限制,通常采用多跳的方式进行节点间消息的互发,这种多跳路由协议为选择转发攻击提供了便利。基于此,提出一种基于随机检查点的多跳确认方案来检测无
分析了当前风险管理的现状和所面临的问题,并通过风险确认,提出了一个风险管理效率判别模型,以对风险管理方案进行判别,找出最佳的风险管理方案。通过分析进一步指出了基于信息资
对不确定性动作建模有助于提高虚拟角色行为表现的逼真度和可信度。现有行为模型由于动作缺少必要的不确定性而显得重复、单调,为此,提出了利用概率区间对角色不确定性动作建模
传统的粗逻辑神经网络可以对信息系统及粗推理决策进行研究,能够深入地揭示粗糙集理论实质,但对于处理非单值输入问题不能取得良好的效果。粗糙神经元的上边界和下边界恰好能解
分析了互联网路由表和路由更新的特征,提出了一种基于叶子节点进行路由表分区的并行IP路由查找方法Leaf-TCAM,分区子表按照流量特征在K个TCAM芯片中进行均衡分布。分析表明,该路