论文部分内容阅读
水果的分类技术一直是国内外农业信息化领域的研究热点问题,近年取得了突飞猛进的发展。但在获取的水果图像规模大、数据特征复杂、局部遮挡、光照变化及场景复杂情况下,水果识别率显著下降。因此,水果识别技术应用到实际农业中仍然面临着诸多的问题和挑战。针对大规模水果种类识别中存在特征冗余大、手工特征设计具有主观性的问题,从水果特征表达和特征自动学习两个方面进行研究:在特征表达方面,研究了RGB水果图像的稀疏编码方法和RGB水果图像的局部约束线性编码方法;在特征自动学习方面,研究了RGB图像特征方法。本文的主要工作如下:(1)提出基于稀疏编码的空间金字塔匹配模型(Sparse Coding Spatial Pyramid Matching,ScSPM)的水果分类方法。首先采用SIFT特征对RGB-D水果图像进行局部特征点提取,克服不同光照及尺度变换影响;然后采用稀疏编码和空间金字塔进行特征表达;最后采用线性SVM分类器实现水果种类识别。实验结果表明,融合SIFT特征和ScSPM特征表达后,水果分类准确率达98.90%,比颜色直方图特征提取方法的准确率高8.02%。(2)提出基于局部约束线性编码的空间金字塔匹配模型(Locality-constrained Linear Coding,LLC)水果分类方法。由于稀疏编码的空间金字塔匹配模型在图像的编码速度上比较慢,采用局部约束线性编码用于空间金字塔匹配模型中以提高水果RGB图像编码速度。LLC同时考虑特征的稀疏性与局部性,水果种类分类正确率达99.25%。(3)提出基于卷积神经网络(Convolutional Neural Networks,CNN)的水果分类方法。该方法采用了深度学习框架--Caffe平台,运用CNN对图像进行本质特征进行自动学习,水果种类分类正确率达99.53%,克服了手工特征设计依赖于经验的问题,提高了水果分类方法的准确性。(4)基于上述研究,进行了水果分类系统的开发与实现。利用传感摄像机在光照变化、360度角度变换以及局部遮挡环境下,采集了苹果、百香果、火龙果和橘子等14类39种不同类型水果图像96815幅,建立大规模水果RGB图像数据库。设计了水果分类系统,使用Matlab图形图像处理工具开发了系统界面,对本论文水果分类算法进行编程实现,并对论文的三种RGB水果分类算法加以比较分析。在水果分类的实验中,本文三种算法中均得到了较高的准确率,其中基于CNN方法的准确率最高,LLC算法次之,SCSPM算法最低;在时间性能上,ScSPM算法所消耗的时间最长,LLC算法其次,CNN算法运算时间最短。在与普通颜色直方图特征提取方法比较时,CNN、LLC和ScSPM特征提取方法比颜色直方图特征提取方法的准确率分别高8.65%、8.37%和8.02%。综合以上水果分类实验结果,说明CNN算法相对于ScSPM算法及局部约束线性编码LLC算法有更理想的分类性能。