一种基于高斯过采样的集成学习算法

来源 :系统工程理论与实践 | 被引量 : 0次 | 上传用户:gameryufei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘研究领域,分类任务广泛存在着数据分布不均衡问题,例如制造状态检测,医疗诊断,金融服务,等等.SMOTE是处理不均衡数据分类问题的常用技术,与Boosting算法相结合可进一步提升分类系统性能,但是这种集成学习容易导致基分类器多样性缺失.基于此,本文提出了一种基于高斯过程SMOTE过采样的Boosting集成学习算法(Gaussian-based smote in boosting,GSMOTEBoost).该算法在Boosting集成框架下构建不均衡学习模型,为了提高分类系统的鲁棒性,采用基于高斯过程SMOTE过采样技术来增加基分类器训练样本的多样性,从而提高基分类器之间的差异.为了验证算法的有效性,以常用的处理不均衡分类问题的算法作为对比方法,采用KEEL数据库里的20个标准数据集对算法进行测试,以G-mean,F-measure以及AUC作为算法的评价指标,利用统计检验手段对实验结果进行分析.实验结果表明,相对于其他算法,本文提出的GSMOTEBoost具有显著的优势.
其他文献
美钻花环、异国奇鸟、闪烁树叶……伯爵为你开启通往闪耀奢华乐园的大门。夜幕低垂,花园里闪烁着万紫千红的迷人光辉。Limelight Garden Party系列诚邀你一同分享这个特别时
900t跨线型轮胎式提梁机是为高速铁路施工而开发的新机型,该机将传统梁场施工中需要配置的轮轨式提梁机的功能集中在轮胎式提梁机中,从而节约一套设备的投资费用。该机集机、
利用节假日外出旅游是一件值得高兴的事情,游客们大多会选择方便、实惠的汽车作为交通工具,这里要提醒各位朋友,以下五种车您莫坐:一是“病”车莫坐。车况不良的车辆好比隐形
论禹越关系阿勤一、关于“越为禹后”的传说在探讨吴越的历史和文化时,“越为禹后”之说总是需要作出解释的首要问题之一。对于这一传说是否具有历史的真实性,历来存在着两种截然相反的意见。晋朝臣瓒日:“自交趾至会稽,七八千里,百粤杂处,各有种姓,不尽少康之后也...
行星数据系统是归档和发布深空探测任务获得数据的在线平台,也是开展行星学科研究的基础。不同的深空探测任务,包括中国的"嫦娥计划"和"天问系列",都存在数据格式转换复杂、数据处理不便、专业性强等缺点,使其难以面向公众。为了有效管理、存档和分析这些数据并发挥其应用潜力,本文基于WebGIS三层分布结构,采用面向对象的时空数据模型,设计并开发了山东大学威海行星数据系统(SDU-PDS)。该系统分为网页版和
在一些长寿的老人中,我们不难发现,他们通常都过着极其普通的生活,并非像人们想象中的那样,有什么保养秘方。他们长寿的秘诀其实就在于健康的饮食、规律的生活习惯,以及不经
1992年9月上市的天龙DVD-5000播放机具体机型、上市日期、价格尚未公布时,就被媒体提前报道称作“高画质的CD机”。其价格(定价27万日元)大大高出号称“旗舰”的先锋DV-S9(
浅谈英文名字Lucia的来源,含义,理解其文化内涵,更好地了解西方文化。 On the Origin and Meaning of English Name Lucia, Understanding of Its Cultural Connotation and
“瑞都无核怡”葡萄是从“香妃”与“红宝石无核”的杂交后代中选出的优良大粒无核新品种。2009年通过北京市林木品种审定委员会审定,定名为“瑞都无核怡”。 “Red no nuc
近年来,随着遥感技术的发展,高光谱、红外、雷达等多源遥感成像手段在精准农业、资源调查、环境监测、军事国防等重要领域发挥着越来越重要的作用。同一场景多源遥感图像观测的地物对象相同,但观测的维度不同,图像的空间、光谱与时间分辨率存在差异,提供的信息既具有冗余性,又具有互补性和合作性。多源遥感图像融合能够综合利用不同来源获取的遥感图像信息,实现更精准、更全面的对地观测,是遥感对地观测领域的核心关键技术。