结合SMOTE和GEPSVM的不平衡数据分类方法

来源 :信息技术 | 被引量 : 0次 | 上传用户:chamlea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文中针对不平衡数据导致分类结果倾斜现象,提出了一种结合SMOTE和GEPSVM的分类方法.该方法利用SMOTE过采样重构训练集,使训练集达到相对平衡,避免了重复样本数据带来的过学习问题,最后用GEPSVM进行分类学习.在UCI数据集上的实验证明了该算法在不平衡数据集上与传统的SVM算法相比有更好的分类效果,在计算时间上也有一定的优势.“,”In this paper,a GEPSVM algorithm based on SMOTE over-sampling method is proposed to address the problem of skewed classification results in classification algorithms.This algorithm utilizes the SMOTE over-sampling method to reconstruct training datasets.As a result,the training datasets are relatively balanced and the over-fitting problem caused by repeated sample data is avoided.Finally,it utilizes GEPSVM to conduct learning.The experiments on the UCI datasets demonstrate that the proposed algorithm achieves better classification results and requires shorter computation time than the traditional SVM algorithm on imbalanced datasets.
其他文献
随着互联网发展和云计算概念的提出,虚拟化普及的速度迅速提高.建设利用虚拟化技术提供服务的虚拟化数据中心也成为IT企业新的发展方向.虚拟化数据中心相对传统的数据中心在
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
今年7月底到8月初、国内 IT 股股价延续了一年多来的跌势,加速下滑。不少 IT 股单周跌幅在15%~20%,如果计算它们今年的最大跌幅,则高达四至五成。机构投资者的代表——证券投
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
没有喊一声“芝麻开门”,阿里巴巴的CEO马云9月9日还是到了厦门.这位被媒体评为“中国互联网之父”的元老级人物,以他IT狂人惯有的作派,在马可波罗大酒店的二楼会议大厅里,冲
从两个大方面论述了班级管理中的批评艺术:批评要注意场合;批评要讲究策略.
本文设计实现了一种轻量级的RFID中间件,对RFID中间件的设备管理、数据处理等核心模块进行了设计,并给出了相关的算法和策略,适合中小企业的RFID应用。
期刊
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥