基于蚁群聚类的不平衡数据过采样方法

来源 :烟台大学学报:自然科学与工程版 | 被引量 : 0次 | 上传用户:cshan225500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不平衡数据集的低分类准确性,提出基于蚁群聚类改进的SMOTE不平衡数据过采样算法ACC-SMOTE。一方面利用改进的蚁群聚类算法将少数类样本划分为不同的子簇,充分考虑类间与类内数据的不平衡,根据子簇所占样本的比例运用SMOTE算法进行过采样,从而降低类内数据的不平衡度;另一方面对过采样后的少数类样本采用Tomek Links数据清理技术进行及时修正,清除数据集中的噪声和抽样方法产生的重叠样例,从而保证合成样本的质量。本文所用训练数据集和测试数据集均为UCI数据集。实验结果表明本算法可以明显提高不平衡数
其他文献
基于农村学生学情的“塑根作文”教学理念,立足农村背景特点,遵循习作教学的规律特征,旨在形成一套从根基做起的习作训练体系。主要通过阅读拓延、文本仿真、思维训练等策略,
<正> 邓小平同志在南巡谈话中,对计划经济和市场的重要阐述,解决了在人们思想领域中长期存在的一些模糊认识,邓小平明确指出:计划经济不等于社会主义,资本主义也有计划,市场
目的探讨超声引导下椎旁神经阻滞(TPVB)对乳腺癌根治术后认知功能及早期康复的影响。方法将85例行单侧乳腺癌根治术的患者按麻醉方式不同分为对照组40例及观察组45例,对照组
氧化铝工业废水水质波动大,PH值在7-13之间变化,悬浮物含量一般在50-1300mg/L范围,试用T-1150絮凝剂之间,取得了非常满意的效果,经济技术指标均显著提高。
介绍了路面底基层与基层施工的管理要求,阐述了控制路面底基层与基层施工质量的要点,分析了需要具体控制的要点,包括混合料拌和质量、运输混合材料、底基层与基层摊铺质量、
目的探讨阿帕替尼一线治疗晚期肝细胞肝癌的疗效及安全性。方法依据治疗方式的不同将60例晚期肝细胞肝癌患者分为阿帕替尼组(n=36)和常规组(n=24)。常规组予以经导管动脉栓塞
<正> 在当代白然科学和社会科学综合的发展趋势中,许多自然科学的理论与方法正在向社会科学渗透。近年来崛起的现代科学方法论——耗散结构论,不仅推动了许多学科的发展,而且
采用石灰乳中和,聚合氯化铝铁(PAFC)絮凝沉降方法对煤矿矿坑废水中的Mn,Fe进行了去除试验研究,在选定的操作条件下,处理后,矿坑废水中的Mn的去除率≥97%,Fe的去除率≥86%,SS的去除率≥95%,通过对中和吸附,絮凝沉
<正> 深化商业企业改革,就是根据“两权分离”的理论,不断完善商业企业的经营机制,从而达到增强企业活力的目的。本文拟以铜山县蔬菜公司的实践,阐明两权分离搞活企业的基本
在一片葱茏之中,宜昌市西陵区南津关小学(以下简称“南小”)显得幽雅而不显眼。但在稍作了解之后,我们马上就会感受到它与众不同的内涵。这份内秀的气质,一如湖北省“新锐班