基于遗传算法改进的少数类样本合成过采样技术的非平衡数据集分类算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:hao8035
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对少数类样本合成过采样技术(SMOTE)在处理非平衡数据集分类问题时,为少数类的不同样本设置相同的采样倍率,存在一定的盲目性的问题,提出了一种基于遗传算法(GA)改进的SMOTE方法——GASMOTE。首先,为少数类的不同样本设置不同的采样倍率,并将这些采样倍率取值的组合编码为种群中的个体;然后,循环使用GA的选择、交叉、变异等算子对种群进行优化,在达到停机条件时获得采样倍率取值的最优组合;最后,根据找到的最优组合对非平衡数据集进行SMOTE采样。在10个典型的非平衡数据集上进行的实验结果表明:与SMO
其他文献
从1985年7月到2010年11月1日第六次人口普查,山西省翼城县"晚婚晚育加间隔"二孩生育试点已经实施了25年,是全国唯一持续这么长时间的试点地区。本文以第三、四、五、六次人口
本文以黔北地区的水泊渡水库为例,对其水环境容量进行计算,并预测到2025年水库流域范围内的污染物入河量,分析该水源地能否达到水质相关要求。预测结果显示,到2025年,水泊渡
研究了保山烟区烤烟外观质量与化学成分的关系,结果如下:1)描述性统计表明,保山烟区烤烟外观质量各项指标平均值得分属中等偏上水平,烟碱、总氮在适宜范围内,总糖、还原糖、
对农村居民点空间增长进行模拟是了解其增长规律的重要方法。以贵州省铜仁市环梵净山旅游经济区为例,运用GIS的空间分析功能,计算了农村居民点的综合影响力,并将农村居民点划
<正>一、教学目标1.在朗读中品味《雨霖铃》的思想感情和意境。2.利用教师博客建立多重的交互性学习平台。3.以听助析,以读带析;通过音乐想象空间的延伸,提升审美感知能力。
<正>有人说,这世上最好赚的钱有两种:一是女人的钱,另一个就是孩子的钱。今年24岁的徐燕,2年前曾是武汉一家幼儿园的"孩子王"。一次,从湖北卫视的少儿节目中,她偶然发现了一
<正> 一、明确毕业论文的性质及撰写目的和要求 毕业论文,就文体性质而言,是学术论文的一种,但严格地说,它又不同于正式的学术论文,而只是为将来进行学术研究、撰写正式的学
<正>一、背景资料人教版课标教材必修四第三单元侧重于思考与领悟。入选本单元的几篇课文属哲理散文或议论文,单元教学要求重点训练学生的独立思考能力。鉴于课文的难度较大,
介绍了以抚顺洗化厂的重烷基苯为原料经切割筛选 ,采用SO3 降膜式磺化工艺合成出烷基苯磺酸 ,再经中和、复配 ,研制出了性能稳定的烷基苯磺酸盐。室内评价结果表明 ,该表面活
<正> 1 曲问句的生成:“所谓曲问,就是问在此而意在彼。”(钱梦龙语)这种简释虽说不错,但总免不了笼统、含糊。“此”有何特点,“彼”又有何用心?语焉欠详,各有彼此。钱梦龙