基于深度学习的目标检测算法研究

来源 :广东工业大学 | 被引量 : 11次 | 上传用户:comeandsit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测,即在图像或者视频序列中定位出目标对象的所在位置并决定这些目标对象的所属类别。它是近年来计算机视觉、模式识别等领域的一个研究热点,在智能监控、人脸识别、人流检测等工业应用中日趋普遍。随着深度学习的兴起与其在计算机视觉领域的密切结合,目标检测领域出现了一批优秀的新算法。这些算法或在检测精度,或在实时性方面有突出的性能表现。本文围绕目标检测算法,系统研究了深度学习与其在目标检测算法的应用,并对目标检测两个经典算法 YOLO (You Look Only Once)和SSD (Single Shot MultiBox Detector)做出改进。本文主要贡献包括:
  (1) 对卷积神经网络的基本运算和基本部件进行归纳总结。本文总结了目标检测算法研究必要的深度学习理论基础,包括常用层、激活函数、目标函数和正则化等。本文的两个检测模型YOLO和SSD,分别在Darknet和VGG卷积神经网络分类模型的基础上连接检测算子微调而成。卷积神经网络是这两个检测算法框架的重要组成部分。
  (2) 提出YOLO算法的批再规范化处理算法。本文结合批再规范化算法处理小批样本以及非独立同分布数据的优势,引入批再规范化处理对YOLO网络结构予以改进:即把卷积层中经卷积运算产生的特征图看作神经元,并对其进行批再规范化处理。同时,在网络结构中移除Dropout,并增大网络模型训练的学习率。实验结果表明,该改进YOLO算法相对于原YOLO算法具有更高的检测精度、更快的实时检测速度以及通过适当设置批样本大小可使网络模型在训练时间和硬件设备方面成本有一定的降低。
  (3) 提出一种加强SSD小目标检测能力的Atrous滤波器设计。改进算法在SSD网络结构的基础上,把第三、四层卷积层产生的特征图经过规范化后连接在一起,然后通过Atrous卷积运算提高这些特征图分辨率。这些特征图共同提供小目标的所需的特征。另外该SSD改进算法还加入SeLU (Scaled Exponential Linear Units)激活函数,并在数据预处理阶段设计了一套数据增广方法。实验表明,该改进算法框架相对于原SSD算法框架具有更高的检测精度,更优良的鲁棒性以及更明显的小目标检测效果。
其他文献
在经济高度数字化的今天,数字技术尽管为市场和消费者带来诸多好处,但也在全球范围内广泛地引起了竞争监管机构和学者的关注和担忧,算法合谋就是这样一个显著的例子。本文在整理国内外技术领域和竞争法领域的已有成果后,对算法合谋的竞争监管问题进行了研究。具体而言,正文共有三个主要部分:  第一,结合技术和反垄断法进行基本讨论,对算法合谋进行界定。根据传统的反垄断法理论,传统合谋分为明示和默示两类。算法在达成合
学位
中国新《刑事诉讼法》在刑事诉讼特别程序中确立了刑事缺席审判程序。该程序的确立标志了中国正式确立了真正意义上的缺席审判程序,贪污贿赂犯罪中潜逃境外的犯罪嫌疑人、被告人的案件中,刑事缺席审判程序与违法所得没收程序均具有适用空间,引发了在追逃追赃工作中如何协调与违法所得没收程序关系的问题。  刑事缺席审判是一项综合程序,包含了对涉案财物的处理问题;而违法所得没收程序只处理涉案财产的处理问题,具有明显的对
自伦敦银行间同业拆借利率操纵事件爆发以来,国内外学者已从银行法、证券法等不同角度切入进行了专业分析。本文以反垄断法的核心卡特尔、固定价格、竞争侵害理论以及和解制度、私人诉讼为基础,在反垄断法的分析框架下,对这一特殊市场的操纵行为进行了较为全面的分析。并结合中国上海银行间同业拆放利率的定价机制、运行现状及潜在垄断风险,借鉴国外相关竞争监管与执法实践,提出了完善建议。  本文第一章论述了选题背景及意义
学位
在美国华裔文学当中,黄玉雪的《华女阿五》首先获得了主流社会的认可,汤亭亭更是凭借代表作《女勇士》把华裔文学推向了一个新的高峰。有关这两部作品的评论文章很多,但是从成长小说的角度探讨它们共同成长主题的文章却不多见。成长是一个永恒的文学主题,而成长小说,作为一种文学类别,在西方文学史上占据着相当重要的位置,具有悠久的创作传统。本文借用女性主义和后殖民主义理论,解读这两部成长小说中女主人公的困惑与成长,
学位
本文以版式编排和电视栏目包装为研究对象,进行了对现在电视栏目包装中存在的版式问题的分析。具体详细的指出了电视栏目包装中版式的优点和不足,并针对其缺点提出了个人的解决意见和修改方法。版式虽然是平静的,但却可以传达意境,且随行生意,意发其内。因此版式编排会给我们带来与心境和心情形似又或相异的心灵感触,或静或动,或高兴或忧郁。时代的审美意识造就了新媒体的蓬勃发展,相继而出的媒体栏目也对应时代的审美对内容
学位
在当今时代儿童对阅读的要求越来越多,然而现在的家长也是非常注重孩子的阅读质量问题。但是在国内的儿童书籍中出现的问题是显而易见的,实质不新颖,书籍模式缺少互动性。而现在的儿童天生喜欢玩耍并且好奇心非常的强,只有在儿童书籍中多填入一些互动性才能更加的吸引孩子们的读书兴趣,从而儿童更能和书籍建立起一种互动性的关系。儿童现在对书籍缺乏的阅读积极性就是应为现在市场上的儿童书籍出现的问题造成的。我们希望未来的
学位
在平面设计形式日益多元化的今天,“黑、白、灰”关系作为一种艺术语言,普遍存在于平面作品的内部,它决定了作品的色彩层次关系。  文章从平面设计中的海报招贴设计作为切入点。首先,通过对中外“黑、白、灰”关系发展历程的叙述,说明了其对招贴设计的影响与作用。其次,海报招贴在色彩结构上,通过协调色、对比色、有颜色与无颜色,以及色彩空间表现的色彩原理的论述,分析了“黑、白、灰”的色彩组成关系。在把握画面中不同
学位
论文着重研究了小型化多频段微带天线的设计思路与研究方法,并分析和推导了一种新型微带天线的工作模式和谐振原理。本文研究了微带天线的小型化与多频段技术,指出了多种技术混合应用实现新型小型化多频段微带天线的可能性。本文提出了一种具有创新性的微带天线的设计思路和方法并进行深入分析和研究,本文基于所提出的微带天线设计思路和方法,设计了一种实用的2.4GGHz/5.2GHz小型化双频段微带天线并进行了仿真和测
学位
近些年来,我国经济发展迅速,各行各业的发展也取得了较大成果。其中,电气自动化工程作为我国发展过程中有着重要地位的一部分,同样取得了非常大的进步,在快速发展的过程中也碰到了各种各样的发展机遇以及严峻的挑战。如果能够实现对电气自动化工程控制系统的有效应用,可以帮助企业提高信息控制的传输速度,而且也能够让电气自动化工程变得更加智能,从而进一步提高工作效率,减少安全事故发生的可能性,为企业在未来的发展提供
基于图像的绘制(IBR)是计算机视觉(CV)和图形学(CG)在技术上很有魅力的一次合作,它以预先获取的图像而不是基于几何模型的方式,通过恰当整合生成新视点的图像。  本文首先选取同名点以校正几何形变,采用归一化积相关函数为选取准则,并以相关曲面的三个特征量的线性组合来评价选取的同名点,提高匹配率。接着本文采用遗传算法优化二维投影模型的8个参数,通过调整遗传算子来消除局部收敛和末成熟收敛问题。在基于