一种基于SVM算法的不平衡数据分类方法

来源 :厦门大学 | 被引量 : 0次 | 上传用户:yangqimeng2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于不平衡数据在现实案例中越来越普遍,因此成为数据挖掘领域的热点。现有的常用分类算法,在对不平衡数据做分类时,效果并不理想,主要表现为将少数类错判为多数类。但是在很多现实问题中,少数类样本才是需要关注的对象。因此,研究不平衡数据的分类问题,特别是提高分类器对少数类样本的识别能力,不仅具有理论意义,更具有现实意义。解决不平衡数据分类问题,主要有两个研究方向:数据层面和算法层面。本文从数据层面入手,设计了 NSSMOTE算法,通过上抽样及对部分多数类样本的类别修改,重构数据集。该方法是基于SVM的第一次分类结果,根据SVM得到的分离超平面,由此生成每个样本到分离超平面的距离,并根据距离远近赋予各个样本不同的权重;再借鉴SMOTE的随机线性插值的思想,随机抽取K个样本,按样本权重求和合成新样本,以此达到扩充少数类的目的。实验表明,经由NSSMOTE算法处理后的数据,与原始数据,SMOTE,ROS算法,BSMOTE算法,ADASYN算法相比,分类性能指标F1和G-mean均有一定提升。
其他文献
2月19日,河南省第十批支援湖北医疗队奔赴武汉;20日,黑龙江省第七批支援湖北医疗队出征武汉……截至2月19日,全国已经有278支医疗队,32395名医务人员从各地驰援湖北。伴随着一个又
报纸
SDL当前已经普遍应用在通信协议开发中,介绍了一个基于SDL的通信协议开发平台框架和平台中对SDL关键元素的实现方法,通过这个平台提高了通信协议开发中从SDL描述到代码开发的效
供给侧结构性改革是“十三五”时期我国经济社会发展的主线。资产评估行业必须适应供给侧结构性改革的要求,主动服务国家发展战略,准确把握资产评估市场动向和服务需求,深化拓展
报纸
论述实践课项目设计在第二语言(汉语)教学中的作用,并具体论述在语言实践中应遵守的几个原则.
随着科学技术的不断发展,信息安全不断受到新技术的挑战,人们逐渐将目光转向安全性更高的生物特征识别技术,如指纹识别、虹膜识别、人脸识别等技术。由于人脸识别具有非接触
万洋高速近日建成通车,标志着我省“田字形”高速公路网全面建成。同时,它也把这样一道考题摆在沿线地方面前:如何充分运用好高速公路带来的发展机遇,推动经济社会发展?日前,有市县
报纸
由"管资产"为主转向"管资本"为主,已成国有资产管理模式发展之基本趋势。鼓励非公有制企业积极参与国有企业资本运作与改革,国有资本新建投资项目同样允许社会资本参股或者控股,
1 前言$$ 2012年初,公司热轧中宽带复产后,设备运转刚刚稳定,急需打开市场局面寻找用户。根据前期的市场调查显示,Q345B是一种综合力学性能良好,应用广泛的低合金结构用钢,在各
报纸
第一条 为了传承和弘扬乌兰牧骑精神,发挥乌兰牧骑红色文艺轻骑兵作用,促进乌兰牧骑事业全面持续健康发展,根据国家有关法律、法规,结合自治区实际,制定本条例。$$第二条 本条例适
报纸
目的:探讨健康体检人群中糖尿病的发病率及相关危险因素,为糖尿病的预防提供参考。方法:对参加健康体检的500名离退休人员的空腹血糖(FPG)、餐后2 h血糖(OGTT 2 h)、收缩压(S