基于深度卷积网络的目标检测系统

来源 :北京邮电大学 | 被引量 : 8次 | 上传用户:galagala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是多媒体和计算机视觉领域的经典问题。近年来,深度学习的快速发展极大地推动了目标检测算法领域的研究。本文实现了基于深度卷积神经网络与回归思想融合的目标检测算法,基于该算法在低功耗嵌入式平台NVIDIA Jetson TX1上开发了实时的目标检测系统。R-CNN、Fast R-CNN和Faster R-CNN等一系列目标检测模型通常将目标检测当做是在候选框中提取特征后的分类任务。这种模型的优点是精准度较高,但无法达到实时性的要求。针对这一问题,本文采用了回归的思想,通过构造一个回归和分类融合统一的多任务损失函数,直接在深度卷积神经网络的特征层上进行候选框的回归与分类,极大地提升了目标检测的速度,在GPU加速的服务器上达到了 120 FPS。为了克服Jetson TX1上内存和显存资源有限的难题,算法在卷积神经网络的深度和模型的规模上作出了平衡。本文算法由8层的卷积层和1层的检测层组成,卷积层采用3×3的卷积核,并且加入了 Batch Normalization层和MaxPooling层,由于全部采用卷积层,有效地降低了模型的参数规模。本文算法的训练分为预训练和微调两个部分,首先在ILSVRC2012训练集上完成对目标检测算法框架中深度卷积神经网络的预训练,达到了Top-1 58.3%和 Top-5 81.3%的分类准确率;然后在 Pascal VOC2007 和VOC2012数据集上对整个算法进行微调,在VOC2007和2012的验证集上分别达到了 54.2mAP 和 47.8mAP。本文在通用GPU加速的服务器上完成对算法的训练后,将算法移植到移动式嵌入平台NVIDIA Jetson TX1上,并开发了包括摄像头输入、图像帧预处理、目标检测以及视频输出预处理的整个实时的目标检测系统,系统的检测速度达到了 26FPS,且功耗仅为11W。
其他文献
网络流行语由于其自身的社会文化内涵及其清新、自然的语言风格迎合了青少年的身心特点,从而对青少年人生观、价值观、生活方式产生了渗透式的影响,随着网络流行语影响力的加
公安机关应当在保卫国家安全、维护社会治安秩序的工作中,充分利用社会矛盾纠纷的调解网络,把复杂的矛盾纠纷分流到调处中心处理。"公调对接"以社会矛盾纠纷的大调解机制为依
在矿山生产的过程中,相关企业、人员和部门必须要足够重视生产的安全性,这不仅能保证全体人员的安全性,还能保证企业的经济效益。但是在实际的生产过程中,安全事故频繁发生,
情报信息工作是党的一项重要工作,所取得的成果对于党的各项方针政策制定与实施具有重要的参考作用。在民主革命时期,党的情报信息工作尤为重要,有时甚至直接关系到党的生死
故意伤害行为在日常生活中频繁发生,严重危害社会经济发展和社会的稳定。已经有很多人对此类案件进行过细微深刻的研究,他们从不同的角度对此类案件表达了自己的见解和看法。
伴随着经济社会的不断进步和构建和谐社会的要求,城市公共管理的技术和环节发生了明显的变化,公民对城市管理的参与程度越来越高,然而在公共管理理论的发展过程中,公民参与并
作者简介:刘良华,1968年出生,湖北洪湖人。华东师范大学教育原理专业博士毕业,华南师范大学教科院副教授。主要研究领域有“教育哲学”,“课程与教育改革”,“教育研究方法”。国家
目的探讨老年精神科患者的临床特点。方法调查2006~2008年老年科全部出院患者病历600份,比较分析其相关资料。结果精神科老年住院患者中以女性居多占58.8%。在精神科疾病中,每
[目的]探讨改良患肢固定悬吊带在腹部带蒂皮瓣移植术后病人中的应用效果。[方法]将2015年3月—2016年3月在我院接受腹部带蒂皮瓣移植术的60例病人设为对照组,2016年4月—2017
新闻媒体在推进社会发展和文明进步中发挥了积极作用,然而,在社会转型期少数媒体忽视了新闻媒体的导向和引领作用,社会责任丧失,极大地损毁了媒体的良好形象和公信力。因此,必须树