论文部分内容阅读
随着深度学习时代的到来,基于深度学习的计数方法在工业检测逐渐应用起来。目前的视觉方法在处理钢筋图像进行计数时面临许多困难和挑战。在建筑工地,工人们使用手动计数的方法对钢筋数量进行盘点既费力又费时(有时需要数小时),由于从建筑工地捕获的图像根据现场条件而有所不同,因此存在一些问题,例如不规则的端面形状,不均匀的照度,颜色不均匀和端面重叠等。这些因素导致使用传统的图像处理算法时,识别结果不稳定。传统的机器视觉计数策略,在速度和精度上表现不佳。因此,开展钢筋端面定位与分割的课题研究具有重要意义和巨大实际应用前景。基于卷积神经网络为研究的手段,围绕钢筋的端面定位与分割为任务,通过合理优化的模型设计,实现了高效的钢筋端面定位与分割,现将研究成果总结如下:1、提出了一种基于滑动窗口的数据增强方法(SWDA)针对当前基于深度学习的钢筋定位算法训练过程中的数据不足的问题,本文提出了一种基于滑动窗口的数据增强方法(SWDA)。该方法包含数据读取的过程,白色掩码区域部分的生成,基于滑动窗口的可填充区域的生成,目标像素和标签的回填过程。所提出的滑动窗口的数据增强方法有两个的优点:首先,它适用于任意大小的目标的填充,有利于增加图像内待检测目标的数量;其次,该方法采用随机选取的方式,有利于增加目标的多样化信息,提高检测定位模型的泛化能力。2、提出了一种斐波那契增量掩模标注方法(FIMLM)为了缓解深度学习中图像分割数据集的制作需要花费大量的人力和时间的问题,一张2666×2000的图像,人工使用PS制作标签数据需要花费30分钟。因此,本文提出了一种斐波那契增量掩模标注方法(FIMLM)用于标注钢筋端面的分割数据集。该方法属于半自动标注的方法,标注过程中引入人工挑出标注错误的掩码,减少了大部分的人力标注成本。经过标注数据扩增后训练的FCN分割模型达到了很好的分割效果。3、提出了一种钢筋检测定位模型(Inception-RFB-FPN)针对钢筋定位算法中的准确率和定位速度的问题,本文提出了一种钢筋检测定位模型(Inception-RFB-FPN)。该模型包含了一个信息保留层,数据抽象层(Inception),RFB-FPN的图像特征金字塔模块和检测层。所提出的钢筋检测定位模型的优势是在兼顾了定位精度的同时,保持实时的检测速度(单张图像检测时间为0.0306s)很适合移动端的应用场景。4、研究了三种全卷积网络(FCN)对于钢筋端面分割的性能高分辨率的图像分割模型的掩码预测会在邻近的目标处聚成一团使得目标的掩码边界不清晰。本文将目标分解为小图像,使用单目标分割再最后合并映射回原图,一定程度缓解了掩码缩聚的问题。FCN的输入图像尺寸,使用统计平均值的近似大小128。VGG16-FCN单张128×128像素的推理时间为2.6156 ms,ResNet18-FCN的为3.2635 ms,ResNet34-FCN的为5.3670 ms。