论文部分内容阅读
在现实生活中,基于某一实际问题进行研究时,得到的数据往往都是不平衡的,比如对变压器进行故障诊断。研究者关注的通常是少数类样本出现的情况,但数据的不平衡是无法避免的,所以研究如何运用机器学习方法去补充少数类样本是十分有必要的。本文基于变分自编码器学习少数类样本分布特征,以实现样本自动扩充,进而提高训练样本均衡性。选择召回率和F1值作为评价指标,分别以原始样本、SMOTE生成样本、ADASYN生成样本和通过基于变分自编码器预处理后的样本为训练集进行对比。实验结果表明,使用变分自编码器(VAE)预处理过后训练的