基于级联结构的不平衡数据集分类研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:com_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受级联结构的启示,提出了一种针对不平衡数据集分类的新方法,基于级联结构的Bagging分类方法。该方法通过在每一级剔除一部分多数类样本的方式使数据集逐步趋于平衡,并应用欠取样技术得到训练集,用Bagging算法训练分类器,最后把每一级训练到的分类器集成为一个新的分类器。在10个UCI数据集上的实验结果表明,该方法在查全率和F-value值上优于Bagging和AdaBoost。
其他文献
提出了一种基于ASM框架的Tagged MR图像左心室分割方法。即从基于典型相关分析的特征融合角度对LM滤波器组提取的Tagged MR图像左心室纹理特征用典型相关分析进行优化组合,再用SVM构造分类器,通过分类器来确定边缘点,驱动ASM模型边界变形得到分割结果。通过典型相关分析的特征融合可以降低分类错误率,提高分类性能;用分类器代替经典ASM模型的基于轮廓灰度的匹配法来确定边缘点具有较强的鲁棒性
叙述了客户机 /服务器结构的地图数据库发展的必要性 ,对客户机 /服务器结构的地图数据库分布管理概念、结构及网络环境进行了论述和设计
结合多智能体的学习、协调策略及粒子群算法,提出了一种基于多智能体粒子群优化的配电网络重构方法。该方法采用粒子群算法的拓扑结构来构建多智能体的体系结构,在多智能体系统
基于模糊最小二乘支持向量机和在线学习算法,提出了一种模糊最小二乘支持向量机的增量式算法。传统最小二乘支持向量机引入模糊加权系数后,有效地提高了其抗噪性能。同时利用
建立了一个合适的IEEE802.11eEDCA信道接入机制的数学分析模型。首先深入研究了IEEE802.11eEDCA机制;在此基础上提出了一种新型的饱和状态下EDCA分析模型。该模型采用二维Mar
本文根据河南宜阳罗圈组发育特征和分布规律,结合华北地台西南缘罗圈组发育和分布概况,论述了其成因和成因类型,提出了罗圈组时代的归属,认为罗圈组应是大陆高原冰川活动产物。其
为了研究时态序列模式演化特征,在给出模式演化片段、模式演化片段集合和频繁模式演化片段定义之后,基于Takens定理,论证了重构空间内模式演化与原空间模式演化之间的等价性
采用独立跟踪区域的划分和公共量测点数据的去藕聚类技术,将原本只适用于单目标跟踪的概率数据关联(PDA)算法改造成能够在强杂波环境中跟踪多个点状目标交叉运动的情况。该算法
叙述了如何生成基于真实地形数据的,具有逼真地球表面文化特征和自然景象的虚拟地理环境视景,主要论述了虚拟地理环境视景生成平台的构成,设计,模型的构建,离散模型的连接组合,光照
单体型组装加权最小字符翻转(WMLF)问题指定个体联配的加权DNA片断数据,翻转权值和最小的SNP位点以推测出该个体的一对单体型。该问题是NP一难的,至今尚无实用的搜索寻优算法。根