基于YOLO的实时目标检测方法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:yezilei311
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的实时目标检测算法逐渐成为研究和应用的热门,实时目标检测算法在智慧交通、智能监控、安防、军事、手术医疗等众多领域有着广泛的应用。行人是目标检测中的一类重要检测对象,视频图像中的行人检测和行人流量统计对于智慧城市安防、经济建设规划等起到重要的作用。YOLO(You Look Only Once)方法是一种先进的实时物体检测方法,与以往较主流的实时物体检测方法相比,YOLO算法的检测速度快,实时效果较好。虽然YOLO系列检测算法已经非常出色,但是YOLO检测模型较为复杂,模型占用较大存储空间,实时运行需要强有力的图形处理器(Graphics Processing Unit,GPU)的计算资源支持才可以实现,在计算资源有限和内存有限的平台上无法使用。近几年的研究中,在前端嵌入式或移动设备上部署检测算法成为热门,这类设备的计算资源和内存资源通常具有一定的局限性,这就对目标检测算法提出更高的要求。Tiny-YOLOV3虽然是为局限平台而设计,但是模型仍然较大,实际执行速度不佳。本文通过对实时目标检测算法YOLO进行研究,重点研究了相关结构模型优化和压缩的算法,针对行人实时检测及计数、计算资源局限平台实现实时目标检测进行研究,在YOLO和TinyYOLO-V3算法基础上进行了算法的改进和优化,具体工作如下:(1)研究了一种基于YOLO算法的实时行人计数方法YOLO-PC(YOLO-based People Counting Approach)。YOLO-PC对检测图像网格的划分更加细致,获得了更多的检测框和更高的检测置信度。该算法基于边界选择的方法,针对性对行人进行计数,在电梯出入口,建筑物出入口等处能有效对行人人流进行统计,可以检测某时刻画面人数,也可以统计某时段人流量。实验表明基于多划分边界选择的YOLO-PC算法在统计人流流量的任务上具有实时的检测速度和较高的精度。(2)研究了一种基于YOLO和YOLO-PC算法改进的模型压缩的人数统计方法SYOLO-PC(Squeezee YOLO-based People Counting Approach)。YOLO-PC由于更加细致的划分导致其参数数量非常大,因此需要在设备上占用大量存储空间,同时使得模型在网络上传下载变得非常耗时。S-YOLO-PC引入SqueezeeNet中的火层模块来优化整体网络结构,同时优化了火层模块在整体网络结构中的使用,实现了模型中的参数数量的压缩。实验结果表明,与YOLO-PC相比,S-YOLO-PC将模型存储空间进行缩减,与此同时精度几乎没有损失。(3)研究了一种基于Tiny-YOLO-V3算法的面向计算资源局限平台部署的实时物体检测方法Tinier-YOLO。通过在Tiny-YOLO-V3中引入大量火层模块来减少模型参数和计算量。在模型压缩到一定程度会对精度有所影响,Tinier-YOLO进一步增加了火层模块的密集连接和更多细粒度特征来提升模型的精度,并部分去除火层模块的BN操作来进一步优化网络的综合性能。最终在保证无损甚至提升检测精度的情况下对模型参数进行大量缩减,减少了大量模型存储空间和计算量,实现在低性能计算平台快速且实时的检测效果。实验表明Tinier-YOLO与Tiny-YOLO-V3相比,所耗费时间复杂度和空间占用都大大减小,更适合在计算资源局限平台上部署。Tinier-YOLO在VOC 2007测试集上实现67.5%的平均精度均值(Mean Average Precision,mAP),优于Tiny-YOLO-V3。在MS COCO(Microsoft Common Objects in Context)数据集上交并比(Intersection-over-Union,IoU)为0.5时的mAP值与Tiny-YOLO-V3基本持平。但是在更严格的评判条件下,即IoU为0.75和0.50到0.95时Tinier-YOLO的mAP均优于Tiny-YOLO-V3。总体来说,Tinier-YOLO在模型空间占用、计算量、实时性、精度上均优于Tiny-YOLO-V3。本文基于实时目标检测算法YOLO进行深入研究,提出了一种基于YOLO改进的多划分边界选择的实时行人检测及计数算法YOLO-PC,这种算法在速度和精度上性能良好。基于YOLO-PC对其模型进行压缩优化后提出S-YOLO-PC,检测算法变得更加高效,减少了大量的冗余参数。本文对YOLO进一步优化,基于Tiny-YOLO-V3提出了一种面向计算资源局限平台部署的实时物体检测算法Tinier-YOLO,该算法不仅使得模型变得更小,计算量更少,速度更快,更适合部署于低性能的计算平台,同时还提高了多类物体的检测精度,是一种更小更快精度更高的检测算法。
其他文献
凯特·肖邦是19世纪末20世纪初的美国女作家。她的作品因丰富的内容和独特的女性人物塑造而深受广大读者的喜爱。肖邦对于她生活过的路易斯安那地区的克里奥尔人和阿卡迪亚人
旅游环境承载力是旅游环境系统支持旅游活动的能力阈值,是描述旅游地能够承受的旅游活动强度的概念。旅游环境承载力的实践应用价值在于保护旅游地的自然与社会经济环境,在减
在三网融合时代,各种媒体间的融合与竞争日渐复杂,传统的网络视频传播人才培养模式已不能适应时代的要求,本文对三网融合时代网络视频传播人才的培养标准及培养模式进行了相
<正>曾湘琴、胡志华、冉继军[18]则运用荷兰学者凡·迪克的新闻话语分析法和框架理论分别对2003年美国国家公共广播电台(NPC)、今日美国(U.S.A Today)和有线电视新闻网(CNN)
测定了四大乙酯在不同酒精度的乙醇-水体系中随贮存时间的变化情况。结果表明,四大乙酯在酒精溶液中水解率为:乙酸乙酯>丁酸乙酯≥己酸乙酯>乳酸乙酯,随酒精度的降低,各酯的
随着我国国民经济持续快速发展,对城市、公路交通的要求越来越高,而桥梁是城市、公路交通中既重要又复杂的组成部分。在桥梁的三大基本结构受力体系中,梁式桥是一种使用最广
玉米醇溶蛋白(zein)疏水性好、易成膜,但纯玉米醇溶蛋白膜脆而易碎,延伸率差,工业化应用难,可用化学方法改变zein成膜性。本文利用玉米淀粉生产的副产物玉米蛋白粉(CGM)为原
定位是无线传感器网络的基本功能之一。近些年来,关于这个问题的研究有很多,但大多数只是停留在理论层面上。而对于无线传感器这个特殊的研究对象,仿真和实际应用的差别巨大,
县域经济是介于宏观经济与微观经济间的中观经济,是我国国民经济的重要组成部分。县域经济的发展和壮大不仅关系到国民经济的健康快速发展,而且也关系到“三农”问题的解决以