基于卷积神经网络的目标检测方法研究与设计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ddsusu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来和智能手机技术的发展,互联网上的图像数据呈现爆发增长。海量的图像数据每天都在被上传到互联网上,如何利用计算机挖掘这些信息中的价值成为一个挑战。其中一些图像数据信息需要对物体进行定位与识别才能有效挖掘,因此目标检测成为了研究的热点。近年来,随着深度学习的不断发展,基于卷积神经网络的目标检测算法相较传统方法取得了极大的进步。但这也产生了一些诸如小目标、重叠目标误检等新的难题。针对这些新的目标检测难点,本文从检测框损失函数的设计出发对当前各种目标检测方法进行分析与研究,并设计不同的损失函数在Cascade_RCNN网络模型上测试,提高网络检测效果。根据对各种检测框损失函数的检测原理的具体分析与实验,本文探讨了各种检测框损失函数的优缺点和其计算检测框损失函数的优劣。据此提出几种从不同衡量标准出发的检测框损失函数,并在采用Res Ne XT-101作为骨干网络的Cascade_RCNN目标检测模型上进行验证,分析其检测结果加以改进。最终综合多种损失函数的优点提出2种新的检测框损失函数COLloss和CLloss,通过实验验证了算法可行性。同时将衡量检测框的评价标准用到非极大值抑制上,提出了基于中心点距离的非极大值抑制算法,并通过权重将其与传统基于重叠率的非极大值抑制相结合得到新的集成极大值抑制算法,通过实验验证算法可行。为了挖掘Cascade_RCNN的检测潜力并进一步提高算法的检测精度,本文在Cascade_RCNN特有的多个检测框回归模块上提出用多种不同检测框损失函数组合的方式来提升检测精度,设计实验与分析。发现了组合损失函数需要组合中的每个损失函数优化方向一致或相似才得以提升检测效果的规律,对比分析了不同检测框损失函数组合的检测结果、训练时损失函数计算总值、训练时间。并在具体的小目标检测、重叠目标漏检和误检上对其进一步对比评价。以此作为评价标准来选取最优的检测框损失函数组合,提出本文最终成型的基于Cascade_RCNN的损失函数组合算法COL+S+S+S。实验结果表明本文提出的COL+S+S+S检测框损失函数组合方式和CL+S+S+S检测框损失函数组合方式可以有效的进行目标检测,原有的Cascade_RCNN在Pascal_VOC数据集上的m AP为0.826,经本文改进后的算法的m AP达到了0.838。相较原方法提升了0.012m AP,从而证明了改进后的方法具有更高的的准确率和召回率。在目标检测的难点,重叠目标和小目标的检测上COL+S+S+S算法在这些特定难以检测的样本上均取得了更好的检测效果。同时COL+S+S+S和CL+S+S+S在检测速度上与Casacade_RCNN原模型都为每秒10.8张,在内存资源消耗上COL+S+S+S方法使用内存10452MB,Cascade_RCNN则使用内存10528MB,证明新的COL+S+S+S的改进方法在提升检测的精度的同时并未明显增加模型的资源消耗和降低模型的检测速度,这使得改进后的模型在各个方面上均优于原模型。相较原模型具有更好的应用价值。在Pascal_VOC数据集的公开榜单上,本文的算法所取得的检测m AP在只采用VOC数据集训练的榜单上达到了相当于第三名的检测效果。
其他文献
随着现代战争中武器研发速度越来越快、作战理念越来越多元化,雷达作为战场的眼睛需要不断创新发展以应对带来的新挑战。其中,在整个雷达家族发展进程中,被动分布式雷达因为在战场生存方面具备的天然优势以及多基站融合检测相比较于单雷达基站检测具有更高的时空覆盖范围、更好的抑制目标闪烁能力的特点,受到了大量学者的关注。同时,被动分布式雷达可以充分利用已有电磁资源来构成网络化、低成本的区域防空预警系统,而不占用珍
目标检测是计算机视觉领域的经典任务之一,在无人车驾驶、交通管控、农业、军事等方面都有很广阔的应用空间。目标检测算法可以分为基于手工设计特征的传统目标检测方法和基于深度学习自动提取特征的目标检测方法,目前后者又分为基于回归的单阶段算法和基于候选区域的两阶段算法。在遥感图像目标检测领域,主要面对的挑战包括背景信息杂乱、目标尺度差距大、小目标多、目标有形变等。因此,本文针对这些挑战进行了研究探索,主要研
随着社会信息化程度的不断加深,下一代移动通信系统对数据速率、容量、时延有着极高的要求,传统射频(Radio frequency,RF)通信早已面临着频谱资源极度稀缺的问题。而自由空间光(Free Space Optical,FSO)是一种以大气为传输介质,以近红外频段的光波为信息载体的无线视距(Line-OF-Sight,LOS)通信技术。与RF通信相比,FSO通信不仅具有丰富且免费的频谱资源,还
视觉是人类获取信息的重要来源。但是视觉图像在采集与传输过程中,由于外界干扰以及设备自身限制,不可避免地会受到噪声的污染,从而降低图像品质。在遥感图像与红外图像中,由探测器阵列响应的不一致性所致的条带噪声,严重影响了后续目标检测识别等视觉处理任务的精度。然而,当前基于传统信号处理理论的条带噪声抑制方法的去噪能力和场景适应性均不足,而基于深度学习的去噪方法又因为计算量大面临着难于硬件部署、实时性差的问
对流层散射通信凭借其保密性强,传输距离远等优点,受到了国内外的广泛关注,被认为是军事通信中重要的通信手段之一。但是对流层散射有严重的衰落效应,其中包括大尺度衰落,频率选择性衰落和快衰落等。本文提出可以在散射环境下使用低峰均比的SC-FDMA通信体制进行信号处理,这样可以避免功放输出信号失真。在任何时候,同步都是一个通信系统首先需要解决的问题。对流层散射通信的路径损耗大,信道环境具有极低的信噪比,同
目前智能终端设备呈现小型化,移动化的特点,但由于体积、功率等限制,这些智能终端能感知到的信息维度较少。现有移动终端上最常见的感知成像设备是光学传感器,其布置灵活,使用方便,但是它很容易受到光路遮挡等影响,对使用环境有要求。基于电磁波的传感器(雷达)则可以避开上述问题,感知更多维度的信息。本文围绕基于移动终端的高精度感知成像雷达相关技术展开研究,以实现近场三维成像和降低阵列成本为目的,研究了实孔径条
新型硬件和嵌入式软件平台的发展,促进移动自组织网络朝向蜂群、协同、智能化的方向发展,展现出移动自组织网络实用性的特性,同时也带来许多新的挑战。另外,移动自组织网络向着大规模、快速组织、快速部署的方向发展,然而传统移动自组织网络的相关技术并不能满足上述需求。软件定义网络通过可编程的数据平面、集中式控制器以及开放的北向接口,可实现网络的快速部署和新型协议的测试验证。因此,融合两种网络特性,实现软件定义
异构网络(Heterogeneous Network,Het Net)中,宏蜂窝与小蜂窝重叠覆盖并使用相同的频谱资源来提高频谱利用率的方式,导致其中的干扰问题尤为严重。早期研究中,将干扰当作噪声处理、解调干扰信号或者正交复用资源等技术已难以满足实际的干扰管理需求。干扰对齐(Interference Alignment,IA)作为一种革命性的干扰消除技术,为干扰处理领域提供了新思路。因此,论文将利用
FBMC作为一种基于滤波器组的多载波通信系统,具有频谱旁瓣低、带外泄露小的优点,使用单独设计的原型滤波器,可以达到比OFDM系统更高的频谱利用率。在不久的将来,随着对FBMC系统低复杂度实现方式的深入研究以及硬件技术的进一步发展,FBMC系统的大规模应用成为可能。在5G或未来通信中,它将扮演越来越重要的角色,并有望成为OFDM的替代性方案,适应更加多样化的应用场景。但是,和OFDM系统一样,它仍然
雾与霾是常见的天气现象,在有雾天气或有霾天气下拍摄的图像,通常存在亮度和对比度下降以及信息损失严重等问题,这些问题会严重影响后续计算机视觉任务的性能。图像匹配算法,作为众多计算机视觉任务的基础,依托于图像特征信息,其性能受输入图像质量所影响。当其输入图像为有雾或有霾图像时,由于图像特征信息损失严重,无法准确地检测到图像特征点,从而造成图像匹配性能下降。因此,恢复图像的特征信息对有雾图像匹配任务来说