论文部分内容阅读
不平衡数据分类一直是人工智能领域备受关注的研究热点。传统的分类方法大多以数据分布基本均衡作为前提,以样本总体的分类准确率作为目标,这对不平衡分类不适用。深度网络可以有效地提取数据的特征,迁移学习能够利用已经存在的相关的任务或数据域的知识处理目标任务或数据域的问题,深度学习与迁移学习的结合称为深度迁移学习(Deep Transfer Learning,DTL)。深度迁移学习利用相关的辅助数据建立深度网络模型,迁移其中有利于不平衡分类的辅助深度网络结构和特征,提高目标网络对不平衡数据的分类能力,节省训练时间,提高模型的泛化能力。本文所做的具体工作如下:首先,提出不平衡数据的二分类迁移学习算法UTrA。UTrA以TrAdaboost算法为基础,根据不同类别的Precision-Recall曲线下的面积auprc计算弱分类器权重,并对不同类别的样本采取不同的权重更新策略,实现不平衡数据的分类。其次,提出了不平衡数据的二分类深度迁移集成算法EUDT。EUDT算法从辅助数据集学习数据特征和深度网络结构,将其迁移到目标深度网络;借助辅助深度网络的结构和特征,通过改进的平均精度方差损失函数APE和平均精度交叉熵损失函数APCE训练,目标深度网络能够有效地学习不平衡数据的特征,提高对少数类的识别能力;集成迁移分类器能够节省选择迁移方法所耗费的时间代价,缓解迁移分类器对多数类的过度倾向,得到有意义的不平衡分类结果。由于AUC指标对数据分布变化不敏感,结合G-mean和BER能更准确地评估不平衡分类算法的性能。综合三种指标的实验结果表明,利用APE和APCE损失函数能够训练出适用于不平衡数据的深度网络;即使在复杂场景中,UTrA算法和EUDT算法也能具有较好的分类性能,既能提升对少数类的关注,又能保持多数类的分类准确度。