论文部分内容阅读
灵武长枣作为鲜食类水果,采摘时间短、工作量大,劳动力往城市的迁移和人口老龄化的加重,导致人工采摘难度极大,亟需智能农林采摘设备代替人工,提高采摘效率。灵武长枣的智能识别是智能化采摘的关键,而图像识别的准确与否是智能识别系统的前提。基于灵武长枣在自然状态下识别的鲁棒性不强、识别准确性不高以及目标定位不精确等现实问题,本文设计了一套灵武长枣图像识别系统,能够高效准确的识别自然条件下的长枣目标,为林果业采收智能装备的研究提供图像识别方面的理论和数据参考。主要采用的研究方法和结论如下:1.建立灵武长枣数据集。在自然条件下,随机拍摄处于成熟季的灵武长枣作为原始数据集,数据集是深度学习的基础,影响网络训练的准确性。共获得预处理后的图像27081张。2.基于更快速的区域卷积神经网络(Faster Region Convolutional Neural Networks,Faster R-CNN)的双损失函数改进。根据经典Faster R-CNN的迁移学习结果,发现所识别的长枣目标无法获得满意的准确性和处理时间,因此首先提出了一种改进的单一损失函数Faster R-CNN模型,通过较小维度的网络深度和卷积次数识别目标,获得较高的实时性,但是识别的准确性不高。为此,再次改进算法,在区域建议网络(Region Proposal Network,RPN)网络中使用双层损失函数,所有特征值在经历Softmax loss函数后获得相应的概率分布,继而使用在角度等因素上限定性更强的A-softmax loss和L-softmax loss函数作并行运算,由此计算出概率值较大的特征,然后映射到特征图像上获得感兴趣区域(Region of Interest,ROI),最后具体的识别出目标所在的区域。获得的双损失函数Faster R-CNN网络的召回率、精准率和平均精度分别是0.9462、0.9296和0.8,相对于其他网络有明显的提高。3.图像识别系统设计。基于以上算法及识别结果,开发了识别系统。系统包括硬件和软件两部分,硬件以工控机为控制和计算核心,控制工业相机在自然条件下拍摄获取图像,联合GPU(Graphics Processing Unit)计算达到实时处理图像的目的。软件的开发是以之前训练好的双损失函数Faster R-CNN网络作为图像探测器,设计出简洁易于操作的GUI(Graphical User Interface),能够实时显示当前相机采集的场景画面和实时处理图像的结果。通过测试,操作一次图像识别系统处理用时的平均值为4.68秒。统计该系统处理图像的结果,获取各评价标准值为:召回率为0.9472,精准率为0.9262,平均精度为0.8,与双损失函数Faster R-CNN结果相比误差在千分位以内。本文所设计的图像识别系统,实现了自然条件下灵武长枣识别,为采摘机器人图像识别系统奠定基础。