基于多类不平衡分类的改进AdaBoost算法研究

来源 :北京信息科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:Fzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于类别不平衡问题,提出了一种多类类别不平衡数据分类的算法——基于改进的Ada Boost的组合算法(Ensemble Ada Boost.M)。为了避免随机欠采样对数据分布的改变,采用基于样本均值分布的方法进行采样;为解决上采样产生的噪音数据,利用结合阈值的方法对Ada Boost分类器进行了改进;针对下采样造成的数据信息丢失问题,在平衡训练集上利用集成的思想,将多个子分类器学习成强分类器。实验结果表明,在公开的几种UCI数据集上,该算法相对其他几种经典算法,在小类的F-score值和整体数据集的G-m
其他文献
<正> 菊芋属菊科,又名洋姜。是一种适应性极强的茎用蔬菜,为一年生草本植物。菊芋块茎质地细致、嫩脆,富含菊糖、葡萄糖和多种维生素及矿物质元素。用其块茎制作泡菜,味香质
期刊
不同于产业同质性假设下将中国产业集聚“只长规模不长效率”的原因归结为集聚过度的观点,异质性企业选择理论显示中国各级政府“引而不择”式的招商政策带来了一些低技术行
我市旅游资源丰富,大峡谷、天河山、云梦山、前南峪、溶洞、岐山湖等景区在省内外有很高的知名度,邢侯墓、唐皇陵、开元寺、玉泉寺、普彤寺、运河文化遗址等都有很强的旅游开发
报纸
目的 探讨老年住院患者体重和体质指数与其他人体营养学指标的关系,建立利用人体营养学指标推算体重与体质指数的方程。方法选择300名住院老年患者,收集其人体营养学指标(体重、
目的:观察泮托拉唑在治疗消化性溃疡的临床效果和安全性。方法:回顾分析我院2011年3月~2012年3月收治的消化性溃疡患者78例的临床资料,全部患者随机分为实验组和对照组各39例
针对别克汽车动力下降、油耗增大、怠速不稳等情况,对产生这些故障的原因逐条排查,最后锁定是由于空气流量计电阻丝受到空气中尘埃的污染造成的。通过清除附着在电阻丝上的污染
<正>该机由浙江恒锐机械制造有限公司生产。其有关技术参数如下:移动高度:16~76mm转子直径:200mm收草方式:侧排式割草机类型:手推
官腔,旧时称官场中的门面话,如今指利用规章、手续等来敷衍推脱或责备的话语。官腔所指的重点往往不在于说话的内容,而在于说话的形式,特别是腔调和声势。对于打官腔的人来说
本文首先对网络爬虫的相关算法目标以及计算的内涵进行阐述,然后按照信息处理的方法将信息特征项进行处理并演变为线索,对网络爬虫相关算法从字符、语言以及语义几个层面进行
<正>患者男,58岁,于入院前40 d在睡眠时发现颈部血管杂音,向左转颈时减轻,向右转颈时增强。后杂音逐渐增强难以忍受并出现走动时头晕。查体于左侧颈部可闻及连续性吹风样杂音