面向不平衡数据流的集成分类算法研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:chenlijuan1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着信息技术在商业、医疗等领域的应用,产生了大量具有动态变化的数据流。这些数据流为知识的挖掘创造了一个巨大的机遇。由于数据流样本具有动态变化、实时性、高速性等特点,同时一个应用程序只能读取一次,这将会引发数据流样本的类不平衡问题与概念漂移问题,这会影响在线学习过程的效果。目前提出的方法多是采用传统采样技术来平衡数据样本,这不能很好地适应数据流样本动态变化的特性,同时也会影响分类器精度,降低分类器的效率。本文针对不平衡数据流分类方法存在的小类样本识别率欠佳的问题,提出了两种面向带有概念漂移的不平衡数据流的动态集成分类算法。本文的主要工作如下:针对目前解决不平衡数据流分类问题中存在的小类样本识别率低和采样算法有可能产生噪声样本点的问题,提出了一种基于动态权重的不平衡数据流集成分类算法(DWES)。在处理带有概念漂移的不平衡数据流样本时,选取保存的之前使用过的小类样本到本数据样本块中来使样本块达到平衡状态。采用集成方式并动态调整分类器权重以适应概念漂移的数据流样本。实验最终结果表明DWES算法整体性能优于其他算法,该算法不仅提升了对小类样本的识别度,而且能快速的适应数据流样本新的概念漂移问题,保持分类器的稳定性。为了进一步改善DWES算法在处理不平衡数据流分类问题中存在的采样方法效率不高以及小类样本识别率较低的问题,提出了一种基于熵的动态集成分类算法(EDAC)来处理带有类不平衡问题和概念漂移问题的数据流。为了解决类不平衡问题中存在的对样本识别精度不高的问题,EDAC采用了基于熵的样本平衡策略。根据信息熵的差异,将数据块样本划分为多个平衡样本对。为了提高对小类样本的分类精度,提出了基于密度的采样方法。最后,为了改善分类器的权值制定方法,提高分类器的性能,EDAC采用自反馈策略确定分类器的初始权重,并根据子分类器对到达数据块的分类性能来修改子分类器的权重。实验结果表明,与现有方法相比EDAC算法可以更好的适应概念漂移的变化,能更好的提升分类器的精度。为了让用户更好了理解文中提出的算法跟进行相应的对比试验,我们设计并实现了面向不平衡数据流的集成分类算法研究展示系统,该系统基于Java语言使用Swing包与WEKA包,并调用matlab编写的算法代码组成,能够完成数据流、算法导入,算法调用,生成折线图与最终结果文件等功能。
其他文献
目的:本研究通过观察活血降糖饮联合依帕司他片治疗气阴两虚夹瘀型糖尿病周围神经病变(DPN)的临床疗效并探索其调节血糖与抗炎的潜在作用机制,为中医药防治DPN的临床药效与药理研究提供参考。方法:采用病例对照的研究方法,按随机对照原则,符合纳入标准的90例DPN患者被随机分配为对照组和治疗组。在原有降糖治疗基础之上,治疗组予中药汤剂活血降糖饮联合依帕司他片治疗,对照组单纯予依帕司他片治疗,疗程8周。观
随着水路运输业的快速发展,船舶航运过程中对水体环境的影响逐渐引起人们的关注。一方面,船舶的排水量逐渐增加,船舶螺旋桨的大型化使得其射流流速及影响范围也逐渐增大;另一方面,船舶航行中其螺旋桨射流对水体产生一定的扰动,进而可能引起床面泥沙扰动,床面表层沉积物受近床面水流脉动作用发生冲刷搬运及再悬浮,使泥沙内部的污染物释放进入上覆水体后引起水质污染。这种扰动程度在什么情况下会引起受污染的泥沙起动并向上覆
近几年来,我国注重文旅融合,统筹协调文化、旅游各种资源,积极推动旅游业实现了新发展,跟团出行已不再是人们首选的旅游方式,取而代之的是自己规划的旅行,一般称为“自由行”,并且越来越多的人在“自由行”过程中,将休息的地点定在了极具特色的青年旅舍,而非传统的酒店和宾馆。北京地区青年旅舍的发展远远领先于我国其他地方,但旅舍的居住环境与质量价格却参差不齐,相应的住客对青年旅舍的满意程度也难以统一。为了更加全
高精度的重力测量在基础物理常数的测定、惯性导航、资源勘探和大地测量等方面都具有重要的科学意义和应用价值。随着激光冷却与操控原子技术的发展与成熟,诞生了一种新的重力测量仪器——原子干涉重力仪。原子干涉重力仪因其在重力测量中潜在的高精度、高灵敏度特性,得到了国内外广泛的关注与研究。原子干涉仪的实现包括原子的冷却与囚禁,初态制备,原子干涉等阶段,每一阶段都需要激光的参与,因此,激光光学系统是原子干涉仪中
电能质量最主要的问题是谐波和功率因数,研究降低谐波含量与提高功率因数的方法越来越受到业界的关注。PWM整流器克服了输入谐波含量高、可控性差以及功率因数低等缺点,广泛用于数据中心、超导储能、新能源并网发电以及感应加热等领域。为了满足交流供电系统高功率因数、低输入电流总谐波失真(Total Harmonic Distortion,THD)等指标要求,需要合理设计PWM整流器的滤波器参数,并研究降低三相
随着中国股市规模的不断扩大和运作机制不断完善,量化投资在发掘市场潜力、获取超额收益等方面的运用空间日益增加。就已有学术成果和业界使用来看,量化基金通过多因素模型对股票进行筛选,以不同的侧重点为投资者提供更加多样化的量化基金产品,对国内A股市场而言是较为有效的投资手段。量化投资的第一步为量化选股,这对于之后的量化择时、统计套利、算法交易及资产配置起着至关重要的作用。另外,股票市场一个典型特征是行业轮
自动调焦技术如今已经广泛应用于各个领域,本课题的研究目的主要是在保证调焦精度的前提下,能够有效提高自动调焦的速度。论文通过对现有三种自动调焦方法的分析与比较,选用了光学检测与图像处理相结合的自动调焦方法。首先通过光学检测法得到光学成像系统的离焦方向与离焦量,直接驱动调焦镜组或像面运动到计算出的位置,然后通过图像法,在该位置附近采集几幅图像并计算其清晰度评价值,采用曲线拟合的方式计算出评价值曲线的峰
相较于传统的集中式电源系统,分布式电源系统被广泛地应用于新能源领域。在分布式电源系统的众多结构中,级联结构是其中最常见的一种连接方式。但由于级联系统中子模块之间的独立性较强,级联后会产生相互影响,从而进一步导致系统的稳定性和瞬态性能变差,因此对子模块的设计和级联系统稳定性的分析尤为重要。为了深入分析级联系统的稳定性和瞬态性能,本文以Buck-Buck型级联系统为例,探究源变换器与负载变换器间的相互
随着人们对海洋资源的不断开发和利用,海事活动日益增多的同时海上事故也频繁发生,事故发生时,及时进行海上救援能够最大程度上保障落水人员的生命安全。人体目标检测与跟踪技术作为视频处理的重要研究内容,广泛应用于视频安防、人机交互等领域。本文主要针对海面场景下的人体目标特性及检测、跟踪算法进行研究,并搭建基于TMS320DM8168平台的视频处理系统,对算法进行验证。针对海面背景动态变化以及含有大量海浪噪
面对日益严重的谐波污染问题,有源电力滤波器(Active Power Filter,APF)相比于无源电力滤波器具有更高的补偿精度和实时响应能力。APF使用三电平结构可以显著提高补偿容量,提升补偿效果,适用于高压大容量和补偿效果要求较高的应用场合。本文针对二极管箝位型三电平有源电力滤波器的相关技术进行了研究。首先,本文在研究有源电力滤波器基本工作原理的基础上,分析了二极管箝位型三电平变换器的工作方