论文部分内容阅读
烤烟生产和收购过程中的烟叶质量分选工作目前是由工人完成的。工人分选主观性强、分级效率低等问题,催生了烟叶自动分选技术的研究。随着机器视觉的发展,基于视觉算法研究烟叶自动分选技术已经成为了一个热门课题。但目前仍然面临着一些挑战:现有的在线图像采集系统得到的数据和理想数据之间存在差异且数据有限;用传统方法手工设计的特征分类准确率不高;基于深度学习得到深层特征需要大量的已标注数据参与训练,但烟叶数据标注困难。针对上述问题,本文设计了烟叶现场数据的预处理流程,并基于深度卷积网络和迁移学习研究烟叶分组和分级。主要贡献如下:通过分析现场采集的烟叶图像,提出了烟叶现场数据的预处理方法。采用中值滤波减少图像噪声,计算Lab空间b通道频数直方图,用直方图双峰法,有效分割烟叶前景部分,并采用形态学的方法分析烟叶图像姿态剔除异常图像,使参与训练的数据尽可能趋于理想。提出了基于深度卷积网络的烟叶分组和分级模型。本文针对烟叶训练样本少、类别单一的问题,基于AlexNet模型采用两步修改法进行参数优化,防止过拟合;删去局部响应归一层同时引入批量归一层,优化网络结构。并提出主动增量学习的方法,通过计算信息熵挖掘困难样本,来避免冗余样本参与训练,从而优化训练过程中标注样本的使用数量。通过在中部橘色烟叶上的对比实验证明,参数优化可以使模型拟合得更好,网络结构优化可以改善训练过程Loss震荡问题,主动增量学习的训练优化可以使用更少的数据训练一个较优的模型。基于迁移学习算法进一步优化烟叶分级性能。针对分级过程训练样本少,准确率不高的问题,提出用训练好的烟叶分组模型迁移学习烟叶分级的低维深层特征表达。之后将其与传统方法手工设计的颜色、形状和纹理特征结合起来表征烟叶分级特征。针对烟叶数据获取实时性和不同批次数据差异影响分类准确率的问题,提出了在线迁移学习的方法。已有数据训练一个分类器,新来的数据再训练一个分类器,在接收到新数据时,用两个分类器的预测结果的加权来表示新数据的类别标签。而且这两个分类器的权重是根据错分样本情况在线更新的。实验证明,融合迁移学习和传统的特征提取方法的特征表达要优于仅用深层特征或传统特征的方法;基于在线迁移学习算法要优于只有新数据进行训练的机器学习算法,其分类错误率更小。