基于深度学习的样本不平衡问题研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:ziquan33071033
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据是深度学习不可或缺的因素之一,在各种视觉任务场景中都依赖着相应的数据集。训练分类器的基本假设是:基于所研究数据集不同类别中的样本数量大致平衡。现代深度学习方法在均匀分布上表现良好,然而在长尾的自然世界中样本数量是不平衡的,这种不平衡给基于深度学习的模型训练和实际应用带来了巨大的挑战。对于近年来备受关注的样本不平问题,本文定义了几种常见的不平衡形式,采用相关开源数据集对其进行重构作为研究对象。在计算机视觉中的样本不平衡问题上,利用重加权的思想对深度学习在图像分类和目标检测上展开研究。本文主要研究工作包括:(1)首先在图像分类中研究了现有工业上常用的对于不平衡数据集的处理方法。对现有的重采样,重加权方法进行了详细的比较分析。使用Res Net18模型在CIFAR-10,CIFAR-100,Image Net-Tiny这三个基准数据集上展开相关实验。通过实验发现重加权方法在处理样本不平衡问题上优于更具稳定性。(2)由于重加权方法在样本不平衡问题上的优秀表现,本文针对重加权方法展开了研究。考虑类别数量,样本数量,类别不平衡度这三个因素对重加权结果的影响。在以往的研究中,权重的设置只与类别样本的数量有关,在敏感的加权方法中,仅依靠类样本个数的信息来确定权重的大小是非常粗略地。通过三个数据集自身的属性来改进现有的有效样本计算方法,从而对现有的有效样本损失的优化。实现了自适应的有效样本加权方法。在构造的长尾CIFAR数据集中证明了我们方法的有效性。(3)同时对于在目标检测中的难易样本不平衡问题,本文提出了一种基于Cascade R-CNN的级联优化的策略。逐步优化训练过程中建议区域的质量同时平衡正负样本,并且通过回归损失来对难易样本在边框回归中产生的梯度进行平衡,从而达到平衡检测器训练过程中的难易样本。在SKU-110K和MS-COCO2017数据集上对本文的方法进行了验证,通过实验证明方法有效地提高了检测器的检测精度。
其他文献
学位
学位
近年来,随着混合所有制改革的推进,国有医药企业进入改革快速发展时期,新冠疫情影响下,如何顺应混合所有制改革要求,提升医药企业混合所有制改革质量,降低改革风险,在严峻的环境中树立企业竞争优势是亟待解决的问题。引入战略投资者,是混合所有制改革常用的一种方式,但是由于引入民营资本与原国有资本存在较大的差异,混合所有制改革引入战略投资者的效应值得研究。基于上述背景,分析医药企业战略投资者引入的动因和引入战
学位
<正>如何持续保持高质量发展态势,打造杭州“第三极”和城西科创大走廊核心支撑?未来科技城给出的答案是在加快构建数字经济生态体系的同时,发展未来网络产业夯实经济高质量发展的底座经过50多年的发展,互联网历经两次迭代,进入未来网络即第三代互联网时代,其标志性特征是与实体经济的深度融合,提供高质量、安全、确定性、定制化的差异性网络服务。当前,我国正在推进数字中国战略和“东数西算”工程,需要高质量网络作为
期刊
报纸
随着互联网的普及和信息技术的发展,人们在享受其带来的各种便利网络服务的同时也遭受无法一一辨别和筛选海量信息的困扰。推荐系统作为缓解信息过载的有效工具,被部署到各大网络平台中,用于改善用户体验并增加商家的收益。本文研究电商场景下基于用户兴趣偏好挖掘的推荐算法,用于提升推荐模型的点击率,缓解目标行为的数据稀疏性等问题。本文的主要研究工作如下:(1)用户在电商网站的一系列行为往往隐含着丰富的用户偏好信息
学位
危岩崩塌是我国山区主要地质灾害之一,常见于三峡库区。自三峡水库蓄水以来,受库水调度影响,危岩体基座消落带常年经历干湿循环,岩体破碎软弱,同时,水库诱发地震频发,加剧了消落带内岩体的劣化及上部危岩体卸荷裂隙的发展,致使危岩体稳定性大大降低。目前,库区巫山段危岩崩塌灾害险情突出,对消落带岩体劣化影响下危岩体的地震动力稳定性研究势在必行。本文基于国家自然科学基金项目,在调研巫山段库岸危岩体的基础上,通过
学位
某含铜污泥冶炼渣(以下简称铜渣)含铜3.50%,铜主要以金属铜和铜镍锡合金的形式存在,含铜物质嵌布粒度粗细不均匀,其中-0.01mm难选粒级占55%左右。对该铜渣开展浮选工艺研究,考察了磨矿细度、粗选pH和丁基黄药用量等条件对浮选指标的影响,并进行了全粒级浮选和筛分—浮选流程的开路对比试验。结果表明,在磨矿细度为-0.075 mm占85.76%的条件下,以丁基黄药为捕收剂,松醇油为起泡剂,全粒级开
期刊
排水路面一直受到广泛关注,在国内外都得到了长足发展与实际工程应用。相比密级配沥青路面方案,排水路面具有较大的空隙率,具有突出的排水、抗滑及降噪的特点,能够有效解决车辆在雨天行驶时产生的水雾现象及在消除路面上的一层水膜,有效降低了安全交通事故发生的几率。但随着通车年限的加长,在复杂的道路环境及自然环境下,传统排水沥青混合料出现整体骨架结构不稳定及沥青粘结力减弱的问题,从而出现飞散、剥落、坑槽等病害。
学位
近年来,有关计算机视觉和深度学习的研究和应用发展迅猛,人体行为识别已逐渐发展为计算机视觉领域里一个热门的研究主题,人体行为识别在许多方面有着重要应用,例如智能安防、视频理解等。图卷积网络的发展逐渐影响了行为识别领域,进一步带动了行为识别的发展,为许多研究人员提供了全新的思路。基于图卷积网络的行为识别的方法虽取得了很好的成绩,但仍存在一些问题。本课题基于骨架数据和图卷积神经网络进行了行为识别相关的方
学位