一阶段目标检测算法中的特征和类别不平衡问题研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:qq619609199
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域的一个重要研究内容,引起国内外学者的广泛关注。一阶段检测器因其比两阶段检测器具有更高的效率和更低的部署成本而在目标检测领域具有较高的研究意义。在实际应用中,影响一阶段目标检测器性能的主要原因是特征不平衡和类别不平衡。特征金字塔中高层和低层特征信息具有不一致性,且在特征融合过程中会出现信息衰减和通道衰减问题;softmax损失函数善于优化类间距离,但优化类内距离能力比较弱,不能很好地解决类别不平衡影响检测精度问题。本文的研究基于此展开,主要从模型和算法角度对这两类不平衡问题,分别提出相应的解决方案,进而提出了一阶段目标检测框架。本文的主要工作和创新点如下:(1)设计渐进特征金字塔网络:原始特征金字塔网络中特征不平衡问题是由特征信息衰减和高级特征通道衰减这两个问题所引发。针对特征信息衰减的问题,特征抛光模块和融合模块能通过融合高低层特征,增强原有特征表示,缓解特征信息衰减的问题;针对高级特征通道衰减的问题,主要是通道数量下降,减少后续预测计算量,同时也带了信息的丢失,亚像素跳跃融合和亚像素上下文增强能缓解特征通道衰减的问题。因而,探索了特征抛光模块、融合模块、亚像素跳跃融合和亚像素上下文增强四个模块的融合对金字塔网络性能的改进,并取得了较好的性能提升。(2)设计软最大自适应损失函数:类别不平衡分为前景-背景不平衡和前景-前景不平衡。Softmax函数会出现有偏的梯度估计,使得分类结果存在误差。针对这一问题,本文提出了软最大自适应损失函数(Softmax Adaptive Loss,SAL)用于解决类别不平衡问题。SAL根据类别的正负样本不均衡程度动态地调整样本的训练过程,SAL可以同时解决一阶段长尾任务中存在的前景-背景不平衡问题和前景-前景不平衡问题。(3)基于以上两种解决方案,本文提出了一阶段目标检测框架(One-Stage Object Detector,OSOD)。本论文将OSOD应用于实际场景,设计了车辆检测系统,验证了 OSOD框架的有效性。
其他文献
3D人脸重建和稠密对齐任务是计算机视觉领域的一个重要分支,通过对人脸的五官信息和轮廓细节信息的分析,神经网络可以学习其内在丰富的上下文语义信息,从而做出精确的预测。基于单张图像的3D人脸重建与稠密对齐是计算机视觉领域的一项挑战性任务,当前大部分3D人脸重建与稠密对齐任务在学习过程中缺乏从几何角度考虑人脸结构特征的相关性,使得神经网络在大姿态、强光照以及遮挡等复杂条件下很难恢复出精细的人脸重建结果与
学位
近年来,深度学习技术在很多领域取得了突出成就。其中,图像分类作为其他视觉任务的基础,更是在各行各业中取得了广泛的应用。深度学习技术通常需要依靠大量的标注数据,但是在很多状况下受各方面的制约,标注数据很少。为了适应这种情况,小样本学习应运而生,成为深度学习技术的一大分支。由于标注数据少,在小样本学习过程中通常会发生过拟合的问题,而将先验规则加入深度学习模型,能够增强模型的泛化能力,提高分类精度。此外
学位
随着科学技术的飞速发展,学者们所研究的被控系统的结构越来越复杂、规模越来越庞大,传统的确定性系统的控制理论已趋于完善.近年来,含有噪声或不确定性的随机模型是当前控制领域的研究热点之一.噪声的存在改变原系统的动力学特征,降低了系统的控制性能,甚至破坏系统的稳定性.因此随机系统的稳定性研究具有重要的理论意义和实际需要.此外,时滞、外部干扰、不确定性在实际系统中广泛存在,这些元素的存在往往会影响系统的稳
学位
随着医学成像技术和计算机技术的不断发展,计算机辅助诊断逐渐成为临床上辅助医生的主要工具。近年来,全球脑肿瘤病人持续增加,产生大量MRI图像,使得影像科医生不得不高负荷工作。因此,迫切需要精准的脑肿瘤图像自动分割技术辅助医生工作。基于深度学习的方法已经快速发展为医学图像分割领域的研究热点,它可以在医疗图像大数据分析中自动学习隐含的疾病特性信息。脑肿瘤图像具有语义简单、三维结构等特点。而深度学习中的V
学位
知识图谱是现代人工智能的核心基础设施,随着人工智能的迅速发展,各种知识图谱被构建出来。与此同时,由于存在着难以去除的噪声与错误等不确定因素,使得知识表达难以完备化,知识图谱中出现了不确定信息。传统的知识图谱表示学习方法不能满足不确定知识图谱的表示及应用需求。因此,带有不确定信息的知识表示学习成为一项紧迫又富有挑战的任务。论文从不确定性知识图谱表示学习模型入手,通过对不确定知识图谱表示学习模型中的得
学位
随着遥感卫星技术的发展,遥感影像空间分辨率可达亚米级。与中低空间分辨率卫星影像相比,高空间分辨率卫星影像具有更丰富的空间细节信息,能够精细呈现出地物的颜色、形状、边缘等。基于像素级或目标级的遥感影像解译方法不能有效提取遥感影像的高层语义信息,场景分类方法能够建模并解译以语义目标构成下复杂空间分布的高层语义信息,可解决遥感影像解译中的“语义鸿沟”问题。目前场景分类方法主要是基于深度学习技术,通过数据
学位
水稻是我国重要的粮食作物,其产量一直受到病害的制约,对水稻病害的类型进行快速、准确的识别尤为重要。传统的识别以肉眼观察为主,具有一定的主观性,且需要深入到稻田实地观察,耗时、耗力,不能满足水稻病害识别实时性的需求。近年来,深度学习技术发展迅速,如何将深度学习应用于农作物病害识别领域已经成为了 一个研究热点。本文以目标检测算法为基础,从实际的水稻病害检测的需要出发,引入深度学习技术和方法开展研究。针
学位
社交媒体网络的崛起,使得交流可以跨越时空和地域,但也加快了谣言在社交网络中的传播,容易引发社会信任危机。因此,研究社交网络下的谣言检测方法,是净化社交网络空间的重要举措,对于解决现实社会问题具有理论价值和实践意义。相比传统的线下谣言,谣言在社交网络上传播会包含更多的附加信息,如用户特征信息、内容特征信息、评论信息等。社交网络谣言特征维度丰富(如用户特征、内容特征、传播特征等),是社交网络谣言检测的
学位
随着基础建设行业的快速发展,工程车的需求量逐年增加。由于发动机电控单元(Engine Electronic Control Unit,EECU)长期处于震荡剧烈、高温及电磁干扰等恶劣工作环境中,导致其故障频发。激励信号是保障EECU正常启动和运行的关键,其具有种类繁多、特征复杂的特性,从而导致其识别困难,降低了 EECU故障诊断效率。由于曲轴、凸轮轴所产生的激励信号特征最为复杂多样并且在电控系统中
学位
目前,分布式光伏电站发展迅速,装机量已超过集中式光伏电站,这对电网提前制定计划提出了更高的挑战。准确的中长期发电量预测不仅能为电网提前制定相应计划提供决策支持,也能为未装机地区提供参考,同时对电网的稳定、有效运行至关重要。与短期发电量预测相比,中长期发电量预测难度更大。首先,中长期时间跨度大,需大量数据作为支撑;其次,实际数据中电站特征和气象特征较少且相关性较低;最后,分布式光伏电站中长期发电量预
学位