论文部分内容阅读
近两年,深度学习在计算机视觉领域取得了长足的进步。特别是通用目标检测方面,研究及应用都取得了较大的突破。但是在一些特殊场景下,目标检测算法表现出了一定的局限性。当待检目标相对密集时,目标间会存在遮挡情况,钢筋计数就是一个典型的场景。一般在建筑工地,对于进场的钢筋装载车,负责验收的工作人员需要现场对车上的钢筋进行点根,待确认钢筋数量后装载车才能进场开始卸货。现阶段所采用的人工计数方式存在繁琐、消耗人力和计数速度慢等问题。针对上述情况,可以通过专业设备采集图片,经高精度、高效率、高鲁棒性的算法模型完成检测计数,最后通过人工修改少量误检的方式智能、高效的完成此任务。综合考虑以上因素,本文提出了一种新的研究思路—将深度学习模型应用于钢筋计数之中。本文主要内容及创新点如下:1.提出了一种基于全卷积网络的密集型多目标识别算法。模型采用多尺度图像金字塔作为输入,通过卷积神经网络生成热度图,再使用后处理算法对多尺度输出进行融合。该模型利用全卷积的特性规避了滑窗带来的大量计算,可解释性强。较小的参数规模使其更加适合嵌入式和移动平台使用,大大缩短了训练时间,适合增量学习。本算法鲁棒性大大优于传统算法,在私有数据集上准确率和召回率均达到95%以上,相较传统算法表现高出10%。2.提出了一种基于弱监督的语义分割和关键点的检测算法,不需要anchor和NMS即可完成检测。算法通过弱监督标签对语义分割网络进行训练,预测目标间的交和并,将检测结果进行像素级位操作,达到近似实例分割的效果。再利用关键点检测对分割结果进行二次判别,最后利用提出的后处理算法生成最终的边界框。模型在DataFountain竞赛数据集上超过Retina Net、Faster RCNN等模型,达到了98.8%的F1-Score。3.利用上述模型,设计并实现了一套完整的棒材智能计数系统。用户首先上传拍摄的图片,系统对输入图片进行数据增强和预处理后,通过上述深度学习模型进行检测计数,并将检测结果进行可视化呈现。用户能够通过便捷的操作进一步修改和完善检测结果,以获得最终计数结果。本文提出的两种深度学习算法能够很好地完成钢筋目标的检测,具备较强的鲁棒性。但是实际场景中存在拍摄角度不规范的问题,这会导致严重的遮挡情况。后续研究可以采用多角度拍摄,再拼接成大图的办法,或者使用激光立体相机进行数据采集等。