基于集成的非均衡数据分类主动学习算法

来源 :计算机应用与软件 | 被引量 : 12次 | 上传用户:TIGERKING2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,处理类别非均衡数据采用的主要方法之一就是预处理,将数据均衡化之后采取传统的方法加以训练。预处理的方法主要有过取样和欠取样,然而过取样和欠取样都有自己的不足,提出拆分提升主动学习算法SBAL(Split-Boost Active Learning),该算法将大类样本集根据非均衡比例分成多个子集,子集与小类样本集合并,对其采用AdaBoost算法训练子分类器,然后集成一个总分类器,并基于QBC(Query-by-committee)主动学习算法主动选取有效样本进行训练,基本避免了由于增加样本或者减
其他文献
论述的基于八叉树分解的岩矿储量估算方法,是针对现有的估算方法普遍存在着对已知数据要求过多、使用繁琐等缺点而提出来的。该方法具有对采样数据的要求不高、使用简便快捷的特点,用在普查阶段的岩矿储量估算有着明显的优越性。
表面肌电信号因为具有非入侵式、易于采集特点,被广泛应用于康复医疗和行为识别等领域。传统的基于表面肌电信号sEMG(Surface Electromyography)的手势识别通常采用数字信号处
随着工业进程和城市化的加快,在城市建设中对自来水的需求量越来越大,而管道是运输自来水的重要途径。本文,基于Dijkstra算法的思想,针对管网系统中管道路线,进行了最短路线
尊重、认识、研究幼儿的个体差异,进而因人施教,因为只有个体的充分发展,才能促进整体的全面、和谐发展。
在建筑施工的过程中,经常会遇到复杂的地形、恶劣的环境等,面对这一系列的问题,如何保证施工进度、降低施工难度、确保施工质量是建设者们面临的主要问题。机械自动化的应用,
线性互补问题在经济,金融,交通和力学等诸多领域有着广泛的应用。因此如何求解结构矩阵线性互补问题的方法已然成为时下数值计算方面的热门话题。而这类问题往往牵涉到大型稀
省局近日召开会议,专题研究部署再就业税收政策落实工作,省局机关各业务处室、西宁市、海东地区地税局负责同志及所属各县(区)地税局局长参加会议并对再就业税收优惠政策落实情
近年来,我国电力工业发展极为迅速。为了更好地满足日益增长的电力需求,电力系统不断优化。无论是电网建设规模还是发电设备,都在不断创新,但在电力运行体制方面。内部设备经