简化的卷积神经网络在目标检测中的应用研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:zhaimeng2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类与检测是计算机视觉中两类最基本的任务,也是其他复杂计算机视觉任务的前提。自计算机视觉这一概念诞生以来,在目标检测领域获得高的表现就一直是人们努力的方向。人工神经网络是较早提出来的用于处理数据处理方法。早期,受限于处理器性能以及神经网络的全连接结构,将人工神经网络应用于目标检测任务的效果不尽如人意。近年来,伴随着图形处理器性能的提升以及各种数据大量的累积,用人工神经网络的方式来执行计算机视觉中的目标检测任务成为一个可行的选择。卷积神经网络的出现之后,深度学习在目标检测任务中不断取得比已有记录更好的表现,因此,将深度神经网络应用于目标检测已经成为一个研究热点。本文借鉴已有的深度学习方法,采用一定的方法简化网络结构,尽可能地兼顾速度、精度。本文提出一种以YOLO为骨架的一阶深度检测网络。它运用可分离卷积的操作。新提出的网络较好地兼顾了速度、精度,可以移植到安卓等嵌入式设备上运行。主要研究内容如下:1、介绍了目标检测的发展历程、目前的研究现状,包括目标检测的任务、评价标准、主要的公开数据集,以及目标检测中所用到的两大类算法。2、调查大量的文献,从人工神经网络的提出、工作机理到它的发展历程逐一作详细介绍。介绍和分析了两大类用于目标检测的深度卷积神经网络:一阶网络和二阶网络。并且分析了它们各自的优缺点。3、通过公式推导分析了深度神经网络主要的参数调优方法——反向传播算法。同时介绍了数种用于参数更新的梯度下降方法以及通过公式推导指出了在通过反向传播算法来进行参数调优过程中会出现的梯度爆炸和梯度消失问题,并列举了数种解决或者缓解这种现象的措施。4、查阅大量的文献,从主要思路和公式推导两个方面详细介绍了现今主要的神经网络压缩方法,其中包括了本文将采取的可分离卷积操作。5、基于前面所提4点,提出一种以YOLO网络为骨架的深度检测网络。该网络采用了可分离卷积模块、使用了预测相对坐标的方式来代替YOLO预测绝对坐标的做法,同时摒弃了最后一层采用全连接层的做法,改用多个连续的标准卷积层代替全连接层。在数据集方面,混合了COCO数据集和Pascal VOC数据集,同时使用了聚类的方法,确定了先验框的数量和坐标。运用分阶段运用不同梯度下降算法的方法进行了参数的调优工作。实验结果表明,YOLO网络的参数数目为56.24 M,本文提出的网络参数个数为7.8 M。YOLO在Pascal VOC数据集中测试的mAP为64.3%,本文提出的网络则为51.1%。在上位机上,经过压缩后的神经网络推理运算速度提高了2倍。实现了在极大精简参数数量的前提下,精度下降不太多。最后,用安卓平台的应用程序,将获得的网络部署于安卓平台,实现从摄像头获取图片并进行目标检测。
其他文献
随着宽带接入技术的飞速发展,宽带用户的讯猛增长与宽带应用服务质量要求以及宽应用内容相对贫乏之间的矛盾日凸现,构建一个开放的、可运营的内容分发网络成为当务之急.文章
有机电致发光(OLED)技术作为新一代显示技术,因其能耗低、视角宽、响应快、易于柔性化等优势吸引了广泛关注,经过科研工作者和企业研发的不懈努力,已进入初步产业化阶段。有机
经常打桥牌的人都知道,桥牌中没有一成不变的东西,但却存在着内在的规律性。桥牌中的各种数字定律.就是这些客观规律的反映和总结,长此以往,而成为人们打桥牌的一般原则。
期刊
本文通过比较广州地区建筑在不同热岛强度下空调采暖能耗计算的结果,研究了城市热岛效应对建筑能耗的影响,可为缓解热岛效应、能源预测、探讨节能措施提供参考依据,亦能为研
随着基础教育改革的不断推进,越来越多的教育工作者开始认识到教育对象的个体差异性,以及满足学生不同需求的重要性。然而,在我国当前大班额集体教学的现实背景下,很多教师依然采用固化的教学组织形式、单一的教法、以及“齐步走”的进度开展教学活动,这种只按照学生共性进行施教的做法忽视了学生个体的差异性,不利于学生潜能的发挥。以“从学生差异出发,实施有差异的教学,为了学生差异发展”为宗旨的差异教学应运而生。研究