论文部分内容阅读
近年来食用油掺假是我国存在的一项食品质量问题,受到了全社会的高度关注。在高价值食用油中掺入低价值油这一以次充好的做法严重损害了消费者的合法权益。目前,食用油掺伪检测主要采用理化方法,这些方法往往花费时间较长,操作过程复杂,不适合用作大规模的食用油掺伪检测。因此,探索高效的食用油掺伪检测方法是当前一项意义重大的课题。近红外光谱技术目前已被应用于石油、农业、纺织等领域,相较传统理化分析方法,近红外光谱技术具有灵敏度高、稳定、能实现快速在线分析等优点。本文基于近红外光谱技术并运用模式分析的方法在食用油掺伪检测领域展开探索,以芝麻油掺伪为例,将芝麻油作为基底油,大豆油和菜籽油分别作为掺伪油按31个浓度梯度各配置372个掺伪油样本,采集样本的近红外光谱数据。在解决食用油的掺伪种类鉴别问题方面,运用K-SVD字典学习算法结合支持向量机建立掺伪种类鉴别模型判断芝麻油是否掺伪和掺伪油类别,并建立PCA-SVM分类模型和单一的支持向量机分类模型作为对照,探究K-SVD字典学习算法在光谱特征提取方面的可行性和有效性;为解决食用油中掺伪油含量检测问题,对参与建模的波长变量采取先粗选后细选的方式,在采用无信息变量消除法(UVE)初步筛选波长变量后,尝试对适用于建立掺伪定量检测模型的波长变量做更深入的分析,将带极值扰动的简化粒子群优化算法(tsPSO)与联合间隔偏最小二乘法(SiPLS)联用建立掺伪定量检测模型。进而找到最适合用于建立芝麻油掺伪定量检测模型的特征波段。最后采用Lasso回归代替偏最小二乘回归建立UVE-Lasso掺伪定量检测模型,Lasso回归不仅能够避免过拟合,还可以对波长变量进行筛选,简化模型并提高预测效率。结果表明:建立的三种食用油掺伪种类鉴别模型均能够较为准确地预测芝麻油是否掺伪和掺伪油类别,其中K-SVD字典学习算法结合支持向量机所建模型在训练集和测试集上均取得了100%的预测准确率,优于另外两种模型,可见K-SVD字典学习算法相较PCA能够提取更完整的光谱信息,学习所得的字典用于建立掺伪定性鉴别模型能够提高模型的效率和准确率;采用无信息变量消除法对波长变量进行初步筛选,然后采用tsPSO优化SiPLS中所选特征波段组合可以建立最优的掺伪定量检测模型,在建立的四种掺伪定量检测模型中对掺伪含量的预测误差最小,而采用UVE结合Lasso回归建立掺伪定量检测模型虽然对预测精度的提升不明显,但在很大程度上减少了用于建模的特征波长变量,同时降低了过拟合风险。