论文部分内容阅读
随着工业4.0时代的到来和《中国制造2025》的制定,我国工业逐步向智能制造领域发展,由制造大国向制造强国转型。在传统机械制造业物料需要人工进行搬运,在物料搬运过程中需要用到大量的搬运设备,在使用过程中普遍存在随意放置搬运设备的现象,每次需要花费较多时间对设备进行寻找和清点,不利于提高生产效率。本文提出基于深度学习的室内多目标检测应用于工厂室内目标检测场景中,通过摄像头对目标设备进行识别与定位,便于搬运人员快速找到所需设备,对于提升生产制造效率、降低设备闲置率、提升工厂智能化有着重要的意义。本文针对室内场景目标检测中存在的光照、遮挡、形变等问题,以基于深度学习的室内场景的多目标检测技术为题,重点研究了室内场景的多目标检测网络的优化,并以对设备检测为例,描述深度学习在室内工业场景多目标检测上的应用。论文主要内容如下:1、YOLO v3算法的测试及研究YOLO v3算法是目前应用最广的目标检测算法之一,其在速度与精度上都有着不错的表现。在对YOLO v3算法进行详细介绍之后,本文使用复杂场景训练集对YOLO v3网络模型进行训练,训练后的YOLO v3网络模型通过横向对比测试,将其与同为基于线性回归的目标检测算法SSD和基于候选区域推荐算法的Faster RCNN算法进行对比测试,从测试对比结果中,YOLO v3算法依靠残差深度网络在检测精度上要优于SSD,但由于检测机制的差异,基于候选区域的目标检测通过二阶段网络的特征提取检测性能要优于单阶段的线性回归算法,YOLO v3的检测精度略低于Faster RCNN 2.3%。基于该部分的研究可以得出结论:特征提取网络的差异对于模型精度有明显的影响。2、基于YOLO v3算法的网络优化通过对YOLO v3的分析,得出其对于复杂场景目标检测存在的缺陷有以下几点,一是对于遮挡目标的检测能力较弱,二是模型的泛化能力较差。基于以上两个方面的不足,本文使用了多感受野的特征提取机制,增强了YOLO v3的特征提取能力。通过实验和测试结果证明了更加丰富的特征信息对于提高网络精度和增强泛化能力有明显帮助,检测精度高于优化前的m AP值。经过对模型的对比测试,采用多感受野机制优化的YOLO v3网络相比于优化前平均精度提升了3.3%,针对于一些复杂目标的检测,精度都达到了6%以上的提升,对于预测框与标注框之间的拟合程度也达到了78.7%(average iou),相比于优化前也提高了3.5%。多感受野的特征提取机制对于提升网络检测性能有明显的帮助,系统搭载优化后的网络模型其整体鲁棒性也有显著提升,实用性更强,优化后的网络适合复杂场景目标检测。3、工厂室内场景下目标检测和目标定位实验及分析将优化后的YOLO v3网络模型应用到工厂室内场景目标检测中,构建了常用设备数据集,对优化后的网络结构进行训练和测试,通过对比测试,优化后的网络模型在工业场景检测上有较高的精度。介绍了两种目标定位算法,对两种目标定位算法进行测试,通过对比测试,基于区域估计的目标定位算法平均误差为1.32米,可以满足目标设备位置的计算。4、工厂室内目标检测系统设计与实现采用搭载有目标检测和目标定位算法的PTZ摄像头对工厂室内场景目标进行检测和位置计算,并将检测图像和检测信息传送到客户端。通过对系统功能的分析与研究,设计了工厂室内目标检测系统。客户端具有显示检测画面、搜索工具和查看目标位置的功能,经过测试,系统对目标检测精度较高,可以满足检测要求。经过对工厂室内场景数据集的测试,基于深度学习的室内场景多目标检测方法具有一定的有效性,实现室工厂室内目标检测任务。