面向不平衡数据流的动态权重集成分类算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:pc84119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流样本分布不平衡会影响在线学习过程的准确性,并存在概念漂移问题.针对带有概念漂移的不平衡数据流分类问题,使用传统的数据流处理方法难以满足需求,本文提出基于采样技术的不平衡数据流动态权重集成分类算法(DWES),该算法将之前的小类样本实例存储,计算当前数据块中小类样本与先前存储的小类样本的相似性,从小类样本集合中选取部分样本加入当前数据块中,再依据当前数据块中合成小类样本的数量使用Bootstrap算法选取相同数量的大类样本形成平衡的样本对.每个数据块中选取多个平衡的样本对来训练当前数据块的基分类器,根据评价指标的熵值大小选取合适的评价指标来动态的调整基分类器的权重,从而适应数据流概念漂移问题.实验在六种带有概念漂移的不平衡数据流上对比五种代表性的处理数据流的算法,实验最终结果表明DWES整体性能优于其他算法,提升了对小类样本的识别度,除此以外DWES算法能快速的适应新的概念漂移,保持分类器的稳定性,而且还能淘汰表现差的基分类器保证分类器有效性.
其他文献
协同过滤推荐算法是个性化推荐系统中研究最多且应用最广的推荐算法之一,针对传统的协同过滤推荐算法中存在的数据稀疏性问题,导致算法的推荐精度不准确和推荐效率低等现象,
在毛主席革命路线指引下,我们兴和县人民以阶级斗争为纲,坚持党的基本路线,大批修正主义,大批资本主义,大干社会主义,抓纲带目,五年之内实现了粮食产量翻一番,在农业学大寨
在毛主席的革命路线指引下,在农业学大(宀在)运动的推动下,我区水(禾刀)生产发展很快,但同时又出现了扩大水(禾刀)面积与水沅不足的矛盾,高产与倒伏疒害的矛盾等,为了充分发
面对非平衡的网络行为数据,单步检测方法难以高效准确地检测全部类别的网络行为.为提升网络入侵类别的检测能力,提出多步式聚类检测思路.首先,基于SVM-KNN算法改进Fisher评分
作为自然语言处理的关键技术之一,词汇之间的语义相关性计算依赖于语义资源.语义资源可分为知识库和语料库;HowNet和ConceptNet是包含中文词汇的两种语义知识库,可为中文词汇
1975年秋,靖江磷肥厂赠送我们一批磷铵,在磷肥厂的帮助下,进行了磷铵的肥效试验,由于当时条件的限制,未能多方面进行试验,现将初步试验结果,简介如下: 试验品种及过程:扬麦2
本文通过对郴州广电电视广播节目监测现状的分析和思考,结合本地实际,提出了建设电视节目数字化监测平台的方案,通过数字化、科学化的手段,为电视广播节目质量评价系统建设提
网络攻击建模利用网络安全设备产生的日志对网络攻击行为进行建模,发现网络攻击的特点与规律,以提高应对突发网络攻击的能力.针对网络攻击建模,本文提出了一种攻击图生成方法
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
从CT(Computed Tomography)影像中准确分割胰腺组织是手术准备及计算机辅助诊断的重要部分.通过对胰腺组织在CT影像中的形态,大小等信息的研究,本文提出了一种基于灰度信息约束水平集的胰腺组织分割方法.该方法首先使用分数阶微分增强方法提高胰腺与其周围组织的对比度,再利用深度学习方法得到部分胰腺组织,统计该部分胰腺组织的信息并建立灰度信息约束项,结合长度项及图像信息项构建水平集能量演化