改进的SSD的目标检测研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:qzhiqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SSD(Single Shot MultiBox Detector)是一种比较流行的目标检测方法。目前,目标检测的方法颇多,使用卷积神经网络的目标检测占据主导地位,但是卷积神经网络在结构上存在固有的问题:高层网络感受野比较大,语义信息表征能力强,但是分辨率低,几何细节信息表征能力弱。低层网络感受野比较小,几何细节信息表征能力强,虽然分辨率高,但语义信息表征能力弱。SSD采用多尺度的特征图来预测物体,使用具有较大感受野的高层特征信息预测大物体,具有较小感受野的低层特征信息预测小物体。这样就带来一个问题:使用的低层网络的特征信息预测小物体时,由于缺乏高层语义特征,导致SSD对于小物体的检测效果较差。本文在分析介绍经典的SSD算法基础上,针对目前较新的SSD算法存在的问题,提出两种改进算法。1、提出一种改进SSD的目标检测算法MSSD(Modified Single Shot MultiBox Detector)。采用基于 FPN(Feature Pyramid Networks for Object Detection)的网络结构对SSD网络进行高低层的融合并且改进了传统上采样的结构。将高层的语义信息融入到低层网络的特征信息中,丰富预测回归位置框和分类任务输入的多尺度特征图来提高检测精度。将SSD训练所使用的VGG16网络替换为深度残差网络,优化候选框回归和分类任务输入的特征图提升检测精度和速度。实验表明,MSSD模型无论在检测精度上还是检测速度上都优于传统的SSD模型。2、提出一种改进的MSSD的目标检测算法TMSSD(Top-Down Modified Single Shot MultiBox Detector)。本文通过优化预测层的通道来提高网络速度,改进了残差单元结构,并且借鉴了 TDM(Top-Down Modulation)结构中所用到的上采样方法,改进了 MSSD中的特征金字塔网络结构,将高层语义信息与低层语义信息融合,提高检测精度。实验表明,TMSSD模型无论在检测精度上还是检测速度上都优于MSSD模型。
其他文献
白从20世纪60年代出现机器人以来,机器人技术已经经历了几十年的快速发展,从最初的传统工业领域向军事、医疗、服务等领域渗透。服务机器人作为机器人家族中的年轻成员,是一
随着无线技术的进步和微型传感技术的发展,无线传感器网络成为一种非常重要的信息收集和处理方式。节点定位是无线传感器网络应用中最关键的支撑技术。由于无线传感器网络往
快速的经济发展、不断升级换代的计算机软硬件以及不断提高的网络速度,互联网已经渗透到人们生活的各个领域之中,再加上物联网技术的火热,各种基于网络互连智能化的应用逐步融入
自动人脸识别技术由于其广阔的应用前景,目前已成为生物识别领域热点研究课题之一。经过近50年的发展,二维人脸识别技术已日趋成熟,但也易受姿态变化等影响。三维人脸识别的提出
并行多处理器系统的容错计算一直是研究者关注的问题,识别故障处理器节点的过程称为系统故障诊断。系统的故障诊断,主要分为两种方式,一种是电路级诊断,一种是系统级诊断。在电路
中文句法分析是自然语言处理领域中的一个重要课题。针对汉语本身的特点,本文将介词用法融入到句法分析结果中,使用介词用法属性对Stanford Parser进行后处理。首先,为了得到
下料是工业生产中不可缺少的重要部分,也是一直以来企业试图节省成本的关键环节之一。目前,在经典的、一般的下料问题研究较为成熟的情况下,实际生产中常常出现的各种特殊下
在当今知识经济时代,知识已成为社会发展的重要资源,如何有效的管理知识就成为当代一个重要的研究方向。截至目前,我国已有近百个规模不同的中医药数据库完成建设并投入使用,
中文信息处理的研究一般分为三个阶段:字的处理,词的处理以及句和篇章的处理。现今我国已经在字的处理,以及词的处理方面取得了很多的研究成果,并得到了很好的实用。例如汉语
我国是一个海洋大国,海产养殖业的发展在我国农业生产乃至经济发展中均占有重要的地位。扇贝精选分级是扇贝养殖收购过程中的一个重要环节,有效、可靠的精选分级一定程度上决