融合过抽样和欠抽样的不平衡数据重抽样方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:walkonair
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总教远多于另一类的样本总数。常用的不平衡数据的处理方法有很多,只探讨利用重抽样方法对不平衡数据进行预处理来提高分类效果的方法。数据抽样算法有很多,但可以归为两大类:过抽样和欠抽样。针对二分类问题提出了四种融合过抽样和欠抽样算法的重抽样方法:BSM+Tomek、BSM+ENN、CBOS+Tomek和CBOS+ENN,并且与另外十种经典的重抽样算法做了
其他文献
目的:探讨代谢综合征各组分个数的递增会否增加动脉硬化的患病风险。方法:在上海市嘉定区40岁及以上居民中进行问卷调查、体格检查、血生化及肱-踝动脉脉搏波传导速度(baPWV)
在多元化背景下建立社会主义核心价值体系对于社会的进步以及人的发展有十分重要的意义,学生对于多元化社会是一个十分敏感的群体,其价观念形成对于自身的发展有着十分重要的
随着我国社会的不断发展,事业单位成为我国重要的服务机构,通过制定相应的管理制度,可以保证工作人员能够按照要求完成各项工作内容。事业单位在发展过程中,档案管理工作对事
功能性消化不良(Functionl Dyspepsia,FD),亦称非溃疡性消化不良、上腹不适综合症、胃肠激惹综合症,其病因目前仍很不明确,发病机制尚未彻底阐明,且无特殊治疗方法.笔者自200
目的考察复方盐酸二甲双胍片体外释放行为,制定合理的溶出度测定条件.方法 (1)以1000ml水为溶出介质,转速75rpm,45min时取样,采用UV法于233nm的波长处测定.(2)以0.02%三(羟甲
从分税制历史根源入手,分析地方政府财政收支不平衡和地方巨额债务现状,找到地方政府财政风险的成因,即地方政府财权、事权不匹配和政府绩效评估的不合理,并从这两个方面给出
建立了气相色谱-串联质谱(GC-MS/MS)同时测定豆芽和番茄中4-氯苯氧乙酸、2,4-二氯苯氧乙酸、萘乙酸、吲哚乙酸、2,4-二氯苯氧乙酸丁酯、吲哚丁酸6种植物生长调节剂残留量的分析
面对环境和能源问题,能量回收以节能减排等优点获得广泛关注。论文重点针对挖掘机动臂以集成型液压发电单元为核心元件构成的能量回收系统展开研究。论文主要研究工作如下:(1
近年来,中国社会呈现出多元发展趋势,给大学生的价值观造成了很大冲击。把握时代精神,强化社会主义核心价值观教育很重要。培养社会主义核心价值观的路径有四:一是思想政治理
作者以《天津海域牡蛎礁区生态修复与生物资源恢复示范项目》所得底栖生物和游泳动物数据为基础,运用生物多样性指数和生态健康评价法对项目实施的效果进行评价。结论为:由于人