不平衡数据的深度迁移学习分类算法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:sisisi22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不平衡数据分类一直是人工智能领域备受关注的研究热点。传统的分类方法大多以数据分布基本均衡作为前提,以样本总体的分类准确率作为目标,这对不平衡分类不适用。深度网络可以有效地提取数据的特征,迁移学习能够利用已经存在的相关的任务或数据域的知识处理目标任务或数据域的问题,深度学习与迁移学习的结合称为深度迁移学习(Deep Transfer Learning,DTL)。深度迁移学习利用相关的辅助数据建立深度网络模型,迁移其中有利于不平衡分类的辅助深度网络结构和特征,提高目标网络对不平衡数据的分类能力,节省训练时间,提高模型的泛化能力。本文所做的具体工作如下:首先,提出不平衡数据的二分类迁移学习算法UTrA。UTrA以TrAdaboost算法为基础,根据不同类别的Precision-Recall曲线下的面积auprc计算弱分类器权重,并对不同类别的样本采取不同的权重更新策略,实现不平衡数据的分类。其次,提出了不平衡数据的二分类深度迁移集成算法EUDT。EUDT算法从辅助数据集学习数据特征和深度网络结构,将其迁移到目标深度网络;借助辅助深度网络的结构和特征,通过改进的平均精度方差损失函数APE和平均精度交叉熵损失函数APCE训练,目标深度网络能够有效地学习不平衡数据的特征,提高对少数类的识别能力;集成迁移分类器能够节省选择迁移方法所耗费的时间代价,缓解迁移分类器对多数类的过度倾向,得到有意义的不平衡分类结果。由于AUC指标对数据分布变化不敏感,结合G-mean和BER能更准确地评估不平衡分类算法的性能。综合三种指标的实验结果表明,利用APE和APCE损失函数能够训练出适用于不平衡数据的深度网络;即使在复杂场景中,UTrA算法和EUDT算法也能具有较好的分类性能,既能提升对少数类的关注,又能保持多数类的分类准确度。
其他文献
本文通过田间试验,研究了咸水滴灌棉田土壤水分和盐分的分布和积累规律及其对棉花产量的影响。结果表明,土壤含水量随灌溉水盐度的增大而增加;咸水灌溉棉田0-100 cm土壤平均
为了分析气候变化和大气CO2浓度增加对长白山阔叶红松林净初级生产力(NPP)的影响,运用本地参数化后的BIOME-BGC模型进行模拟,并以实测NPP和增强型植被指数(EVI)进行验证。模拟结
给出了正交矩阵的左右逆特征值,并进行了相关讨论.
本文从我国现阶段低质量人口扩张的特点出发,对生育权稀缺状态下的剩余孩子生育权配置和交易模式进行了对比分析,认为生育权向生育户配置比向政府配置具有更高的市场效率.它
随着计算机与网络的普及,Intemet迅速成为人们生活中的重要组成部分,网页制作与网站建设也成为网络时代必备的技能之一。当今社会对网站建设人才的需求量越来越大,网站建设已经
彩云之南,山水多姿,峰峦俊秀,江河棋布,雄关漫道,沃野星缀,气候立体,物产丰腴,民族众多,文化璀璨。在这片富饶的土地上生活着26个世居民族,村落交错,阡陌相出入相友,言语互他们
对某污灌区的土壤剖面进行采样分析,利用不同的评价方法进行评价,结果表明,土壤中金属元素Cr、As、HG、Cd、Cu、Pb、Ni、Zn和持久性有机污染物BHC、DDT含量有上升趋势,80%以
总结了行道树在生态化城市建设中的作用。
1 世界梨生产1.1 总面积与总产量世界上栽培梨分为西洋梨和东方梨两大类.西洋梨(又称洋梨)为软肉型,需后熟方可食用.东方梨(亚洲梨)为脆肉型,有秋子梨、白梨、砂梨和新疆梨.
舆论形成是个体因素与外部影响共同作用的结果.个体因素包括个体理性的认知与非理性的情绪因素,外部影响则包括文化、认知以及行为模式的作用和社会网络上个体之间的影响,而