基于深度学习的目标检测算法研究

来源 :东南大学 | 被引量 : 6次 | 上传用户:sea0075
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习,作为人工智能一个重要的分支,现在受到人们越来越多的关注,而目标检测这个计算机视觉的基础性研究领域也因为深度学习的快速发展焕发出了新的活力。目标检测即是在图像或者视频中找到目标物体的位置,并确定物体的类别。由于图像中目标的形态和大小不一,数量和位置不定,这使得目标检测一直是计算机视觉检测领域的难题之一。传统的目标检测采滑动窗口和图片缩放的方式,这种方式检测效率差,精度低,为了改善传统检测算法的弊端,将深度学习和目标检测相结合的方法应用而生。基于深度学习的目标检测算法主要分为两种,一种是以R-CNN系列为代表的twostage目标检测算法,这类算法要先产生候选区域,然后再对候选区域进行分类和边框位置的修正,另一种是以SSD、YOLO等为代表的基于回归的one-stage目标检测算法,这类算法不需要产生候选区域直接对目标物体进行回归。本文主要针对Faster R-CNN和SSD两种目标检测算法进行了深入研究,具体内容如下:(1)对深度学习技术和目标检测算法展开了研究,分析了卷积神经网络和常用目标检测技术的工作原理。(2)通过从网络结构、锚框的生成和训练流程来对Faster R-CNN的算法原理进行了深入研究。针对原算法存在的一些问题,本文在原网络结构中加入了特征金字塔网络,并对目标类别的分类标签进行了优化。此外还对实验的训练图像进行不同的变换来扩充数据集,这些使得原算法的检测效果得到了优化。(3)研究了SSD算法,对SSD的整体结构、先验框的生成、先验框的匹配和难分样本挖掘以及损失函数等原理进行了深入分析。为了改进原算法,一是在原算法的网络基础上加入了Top-Down模块,二是优化了分类损失,三是使用了Soft-NMS算法。(4)在计算机平台上使用了深度学习框架MXNet对Faster R-CNN算法和SSD算法进行了改进前和改进后的训练实验,并对实验的检测结果进行了分析,结果显示检测效果改进后相比改进前得到了提高。
其他文献
鬼成像,也称之为关联成像和符合成像,是近几十年来量子光学领域的热点与前沿的技术之一。与传统的成像技术相比:鬼成像技术具有非定域性,可在参考光路通过符合计算得到信号光
当前我国正处于社会主义上升阶段,社会结构在不断调整,经济格局在不断变化,此时期是社会问题、突发事件多发阶段,危机无处不在无时不发生。这些危机带来的灾害和损失严重阻碍
干部档案管理、工人身份人员档案管理是人事档案管理的两大内容。一直以来,大部分地方强调对干部人事档案的管理,放松了对工人身份人员人事档案的监督管理,放由所在单位“自行”
初中思想品德课是初中德育教育的首要学科,对其学习得好与否,将关系到学生的品格、态度甚至人生的成败。本文就初中思想品德教学中存在的问题做深入探析,并提出初中思想品德教学
在小提琴演奏艺术和小提琴教学法中,换把占有重要的位置。它不仅是“左手技术的本身”(扬波尔斯基语),而且与音乐表现、乐句处理、演奏风格等重要问题都有密切的联系。因此换
本文提出了一种新的离散网络平衡设计二层规划模型,模型同时考虑了新增路段及已有路段的扩容,而且允许不同等级的扩容选择。模型求解中,上层采用粒子群算法,而下层则采用本文作者
现有文献关于空间差异环境专利授权的最优合同基于固定费与可变费,而不是更一般的授权合同。针对这一问题,分析了厂商间的两部制最优专利授权策略。无论专利大小如何,授权合同同
本文根据管网和水泵的运行曲线,阐明了供水系统的变频调速节能原理,研究了基于城市供水管网测压点的分时变频恒压供水优化方法与模型,并对该方法在某自来水公司的应用节能效
作为合格的中学音乐教师,必须是符合中学音乐教育发展的要求,受学校欢迎,学生喜爱,胜任中学音乐教学,完成课外音乐活动的组织、辅导及直接参加一些艺术表演活动的音乐教育专
应用文写作能力是学生走向社会,工作和学习必须具备的重要能力之一,文章通过对当前学生应用文写作教学普遍存在的问题进行分析透视,提出了提高应用文写作教学实效性的对策和思路