论文部分内容阅读
目前我国所采用的烟叶分级方法是人工分级,它依靠操作人员的经验和感官判断,耗时、费力且具有很大的主观性;分级准确率依赖于收购人员的经验和环境,所以烤烟叶的智能分级势在必行。近年来烟叶智能分级方面的研究主要集中在基于图像特征的分级方法。利用烟叶图像提取与人工分级因素相关的颜色、纹理和几何等图像特征,采用一定分类方法进行烤烟叶的分组和分级识别。然而这些图像特征很难反映与烟叶分级密切相关的厚度、成熟度、油分等因素。光谱可反映很多物质的结构及组成成分,因而被广泛地应用于很多领域。近红外光谱分析技术在烟叶成分诊断及含量估计、烟叶分组和产地的判别等方面的研究,为其应用于烤烟叶的智能分级提供很好的依据。烤烟叶的近红外光谱能很好地反映与烟叶分级密切相关的身份、厚度、含油量、成熟度以及颜色等信息,但由于数据维度高导致在线实时分级所需时间长的缺点,因此本文的研究内容如下:1.光谱类型、范围、间隔及预处理方法的研究。本文比较了反射、透射两种光谱在不同范围、采样间隔情况下的分级准确率。分级结果结合光谱采集的便利性和实时性,表明用于烟叶分级的最佳光谱类型为反射光谱、范围为1500~2400nm、最大可采样间隔为10nm。2. SVM的参数优化。烤烟叶分级过程中的近红外光谱数据具有小样本、高维度特性,SVM在解决上述问题方面有许多优势。通过比较了RBF和线性两种核函数以及PSO、GA和网格法三种参数优化的分组、分级准确率,最终选择SVM模型的核函数为线性,惩罚因子C用网格法搜索最佳。3.烤烟叶分级模型的研究。SVM是最优的二分类器,在多分类时可构建多个二分类器,统计每个二分类器的输出,投票决定SVM的多分类输出。烟叶分级时有先分组再分级的级联分级模型和并联分级模型。级联分级模型需要建立的二分类器少,判决时间为0.114819s,但是颜色、部位分组出错时易造成误差累计,最优分级准确率89.8%(间隔2nm);并联分级模型则需要建立更多的二分类器,判决时间增加至0.396101s,但分级准确率达到93.88%(间隔2nm)。4.基于聚类的光谱特征选择。本文提出基于聚类的思想进行烟叶光谱特征选择。首先,根据类内参数1删除类内差异较大的部分特征,保持光谱数据的类内聚集性;其次,根据类间参数2删除类间差异较小的部分特征,保持光谱数据的类间差异性。直接剔出对分组带来不良影响的光谱,从而有效地减少原始光谱数据的采集。级联分级模型中,最少特征输入分级准确率为87.78%,光谱特征从451减少到312个,减少了30%。5.基于BPSO和被选概率的光谱特征选择。用BPSO方法进行光谱特征选择并统计分析各个波长的被选概率;比较得出选取被选概率大于60%的特征与BPSO选择的最优特征的特征数目相当且分级准确率差别不大。进而提出按波长的被选概率和BPSO选择的特征相结合的筛选方法。先用聚类删除部分特征再结合上述方法进行特征选择的结果:间隔10nm情况下,并联分级的准确率达到88.75%,判决时间为0.040926s,选择出的特征数47个比原始特征数91个,减少了48%。