基于混合重采样的非平衡数据SVM训练方法

来源 :微型机与应用 | 被引量 : 0次 | 上传用户:xiaosun988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的SVM算法在非平衡数据分类中分类效果不理想的问题,提出一种基于分类超平面和SMOTE过采样方法(HB_SMOTE)。该方法首先对原始训练样本集使用WSVM算法找到分类超平面,然后按一定标准剔除负类中被错分的样本、靠近分类超平面的样本以及远离分类超平面的样本。在UCI数据集上的实验结果表明:与RU_SMOTE等重采样方法相比,HB_SMOTE方法对正类样本和负类样本都具有较高的分类准确率。
其他文献
子空间分割方法一直是一种重要的机器学习方法,这些方法在人脸识别和基因表达数据识别等研究中有较好的聚类准确率。然而,这些方法在对高维小样本数据进行聚类时难以取得理想的结果。为了解决这些问题,借鉴流形降维中的局部保持投影法和最小二乘回归子空间分割法,提出流形降维最小二乘回归子空间分割法。该方法通过局部保持投影进行降维,再利用最小二乘回归子空间分割方法实现聚类。在6个生物基因表达数据集和2个图像数据集上
然而不论是教师的课堂演示实验,或是学生的自主探究实验,都或多或少存在以下不足:  1.利用铜丝伸缩进退虽能取得控制反应进程的效果,但铜丝从胶塞侧面挖出的凹槽进入试管,一面与胶塞紧密接触,一面与试管壁有摩擦,实际操作中既造成不便,又损坏了实验仪器,还可能出现气体泄漏的问题。  2.实验缺少尾气吸收装置,导管与品红溶液直接相连,实验时易出现倒吸现象。  3.实验中采用较多量的浓硫酸,滴加和加热过程存在
有一位心理学家说过:"人类本质中最殷切的需要是渴望被赏识。"赏识,是指充分认识到人的积极因素,并加以肯定与赞赏。在实际工作中,笔者深深体会到:对学生进行赏识教育,是促使学生
在国际上,随着苏联、东欧的解体,坚持社会主义的国家屈指可数,现有的社会主义国家相对贫穷;而以美国为代表的资本主义国家经济发达、高科技转化的生产力劲猛。但我们通过对走资本
大家都知道,作文在中学语文里和基础知识、阅读理解合称“三大板块”,地位非常重要。作文是衡量中学生语文素质的一个重要尺度,在现代社会里是进行交际的重要手段。作文教学是中学语文教学的重要组成部分,要培养和形成中学生比较出色的写作能力,在中学语文教学中就要十分重视作文教学。  “写作可贵而难为”。一说起作文,目前许多中学生都普遍感叹:作文之难,难于上青天!每次教师一布置题目,学生们便搜肠刮肚,捉襟见肘
计算机教学效益就是在计算机课程教学中投入和收效之比。如果在这门课程的教学上投入了很多资源和人力,但教学效果还不理想的话,就可以说教学效益很低。当然,我们都希望能提高教学效益,但就目前情况来看,计算机教学效益低是一个普遍存在的现象,这其中的原因不但包括计算机这门课程的特殊性,还包括学校及教师的一些教育教学方法有待完善。很多学校和教师都在为提高计算机教学效益而不断努力。我认为要提高计算机教学效益,就要
素质教育、创新教育、终身教育都是新课程标准所提倡的。新课程标准既要求我们要做好基础教学,又要求我们提高学生的历史思维能力,培养学生情感态度价值观,利用历史知识处理现实问题的能力,促进学生的知识体系的完善和能力的发展。那么,在高中历史教学中,我们该如何贯彻新课程标准的教学思想,如何开展有效的历史教学呢?  一、教师要摆正自己的角色  新课程标准下,教师不再是教学的主宰。我们教师应成为教学的引导者、促
所谓英语后进生,即英语基础较差,基础语法薄弱,语言综合运用能力较低,在英语学习中有困难的学生。而阅读教学又是高中英语教学的重头戏,因此,针对英语后进生进行有效的阅读教学,是很重要的。  一、课堂教学  1.指导英语后进生做好充分的预习。高中英语阅读文章篇幅长,长难句多,生词多,因此,必须首先指导后进生做好充分的预习。预习不只是对照生词表把生词的汉语意思标注上去。教师应指导学生在预习课文时,首次阅读
目前的体育教学存在不少的弊端,由于学校领导对体育教学不够重视,从而影响整个学校的体育教学质量。其次是体育教学的经费不到位,难以满足正常的体育教学需要。再次,一些体育教师对体育教学的重要性认识不够,从而放松对学生的要求。最后是一些体育教师自身素质水平的不足,严重阻碍了体育教学的顺利进行,导致了不良的后果。作为一位长期工作在体育教学战线的中学体育教师,笔者深深地认识到自身职责的重要性。本文笔者从自身的
群智感知是一种招募移动设备用户完成数据采集、云计算等任务的感知模式。但在不对称信息场景下,因云平台无法观测到用户私人类型信息而处于不利地位,产生不能有效利用用户、导