基于密度峰值的Adaboost算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:shuimolanting
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不平衡数据分类问题,提出一种基于密度峰值的Adaboost算法。将训练数据划分为多数类和少数类,统计各自的数量;在多数类样本中,对由密度峰值算法快速聚类生成的各个簇按照采样率 进行随机欠采样,将所采样的多数类与原少数类合成新样本,降低数据的不平衡性;将合成样本带入以决策树为基分类器的自适应增强模型,通过改变样本权值分布提高该算法模型对于不平衡数据的分类性能。实验结果表明,该算法在评价指标ROC曲线下的面积(AUC)、G-mean和balance方面优于或者部分优于其它对比算法。
其他文献
【正】 五四运动作为中国新民主主义革命的开端,史学界一直重视对它的研究。党的十一届三中全会以来,史坛活跃,五四运动历史的研究更为突出,出版了大量专著、论文、回忆录及
文章通过建立演化博弈模型,分析了信用担保市场主体之间的策略交往及相互影响。演化分析结果显示,博弈双方的行为将演化为两种模式:(自利,自利)和(互惠,互惠),前一种模式为行为演化的不
随着我国国民经济的不断增强,人们的生活与工作对用电量的需求日趋增加中,同时对用电可靠性要求愈来愈高。提高供电可靠性已成为电力企业的头等大事,而推广使用配电线路带电作业
Tm3+∶YVO4晶体能级结构和光谱学研究陈学元罗遵度(中国科学院福建物质结构研究所,福州350002)StudyontheEnergylevelStructureandSpectroscopicCharacteristicsofTm3+∶YVO4...
一、普拉达的品牌故事  意大利奢侈品品牌普拉达(Prada)是全球奢侈品行业的领先企业之一,公司不断创新业务模式,成功地将工业化的生产流程、精湛的制作工艺和卓越的手工产品相结合,甄选优质原材料,制作奢华时尚产品。在全球领先的市场调研公司明略行(Millward Brown)公布的2013年Brand Z全球品牌百强排行榜上,普拉达排名第95,品牌价值95亿美元。  1913年马里奥·普拉达在意大利
建筑产品的质量和其中的机电设备不但要有较高的质量,同时要尽量降低其噪音和振动,避免影响室内用户的身心健康.文章重点研究机电工程安装中需要严格控制的施工技术,从而提升
管道腐蚀设计以及管材的选用等是个特殊的过程,在整个落实阶段,需要从实际情况入手,做好具体布置工作.核电管道的设计中管材材料、流体性质以及管道所处的环境、温度、压力等
随着我国航空行业的不断发展,乘客对于飞机乘坐环境有着更高的要求,而其中飞机机舱中的温度、湿度是否在舒适范围内已经成为主要的判断标准.当飞机空调出现故障时,机舱中的舒
文章从银行和企业两个行为主体视角,对公允价值会计的顺周期反馈机制进行了深入研究。结果显示,不仅基于银行的外部监管行为和银行自身的内部风险控制行为视角,公允价值计量具有
为降低软件缺陷预测对标注样本的需求,将软件缺陷预测问题模型化为PU场景下的迁移学习问题。不对要进行软件缺陷预测的目标领域样本标注类别,只对跨工程的源领域数据集标注部