【摘 要】
:
类别不平衡问题在机器学习中比较常见,往往会对学习过程产生一定负面影响。对数据集中的少数类样本进行扩充,是解决类别不平衡问题的一种有效手段。对于低维数据,已经有多种
论文部分内容阅读
类别不平衡问题在机器学习中比较常见,往往会对学习过程产生一定负面影响。对数据集中的少数类样本进行扩充,是解决类别不平衡问题的一种有效手段。对于低维数据,已经有多种经典方法可以进行有效的数据扩充;而在图像这种高维数据上,经典方法则不能发挥有效的作用。针对图像数据扩充,现在常用的手段多为基于图像变换的过采样方法。这类方法一定程度上可以减小类别不平衡问题带来的负面影响,但往往效果有限。生成对抗网络作为神经网络模型的一种,近年来得到了广泛的关注与研究。输入一类样本,生成对抗网络可以输出与这类样本非常相似的人工样本。利用这个性质,本文使用生成对抗网络进行图像数据扩充,缓解图像类别不平衡问题给分类任务带来的影响,并就人工样本中的底层噪声问题进行了分析,出了解决方案。本文的主要贡献包括:1)结合循环一致性对抗网络(CycleGAN)的设计思想与残差块的结构,设计了适用于图像扩充任务的CycleGAN。2)使用CycleGAN扩充少数类图像样本,升了分类器在图像类别不平衡问题中的分类性能,同时通过对比实验探讨了人工样本数量等多种因素对实验结果产生的影响。3)分析了Cycle GAN生成的人工样本中存在的底层噪声问题,展示了底层噪声给分类器带来的负面影响。4)出了通过固定分类器来训练图像的方法,削弱人工样本的底层噪声,进一步高了分类准确率,同时使得重复实验的结果更加稳定。
其他文献
<正> 滚花工艺在机械加工工业中获得广泛应用,人们常见的交通运输工具的驾驶的方向盘,或操作机床、仪表、测试设备上的滚花手柄、滚花圆环等均具有较大的摩擦系数,因而,滚花
在没有靠模銑床的情况下,我們利用通用可调銑盘形凸輪工具加工凸轮,效果良好,現介紹如下。一、工具结构及工作原理该工具结构見图1。工件和靠模板同时装在工具中国轉盘的靠模
站在紧靠沁阳市沁北产业集聚区的太行山上,向南远眺,高大的厂房鳞次栉比,绿树游园点缀其中,曾经的荒石坡,已经被一个气势恢弘、绿色生态的工业城所取代,一条财富集聚带正在迅速隆起
<正> 渗碳的质量指标主要指表面碳含量、渗层碳浓度梯度和渗层深度。表面碳含量和碳浓度梯度主要受控于气氛的碳势,渗层浓度主要受控于温度和时间。卡博—马格法为气体渗碳做
<正> 在贯彻新的齿轮标准(JB179—83)工作中,提高齿轮加工精度的同时,还应进一步提高安装精度,才能较全面地推动齿轮新标准的实施。齿轮是安装在箱体内的轴上(固定或滑动),轴
以工矿复垦区为实验区域,基于ASD FieldSpec 4高光谱遥感数据,结合实测的土壤重金属含量,利用回归分析与特征选择方法,开展了基于高光谱数据的土壤重金属含量反演研究与实验
壮大县域经济是统筹城乡发展的重要载体,因为县域经济是统筹城乡发展的操作台、着力点、突破口。壮大县域经济、统筹城乡发展的基本思路是:以工业化为主导,以城镇化为支撑,以现代
<正> 图1所示为盘类典型零件,需磨削以外圆及端面为定位基准的内孔,直径D_0=25~45mm,内孔与外圆的同轴度0.02mm,与端面的垂直度为0.018mm,内孔公差带代号H7。为了减少专用磨削
上市公司的治理结构与会计信息的质量息息相关,二者的关系也直接影响着企业的发展。文章从上市公司的治理结构入手,阐述了上市公司治理结构和会计信息质量二者之间的关系,分