论文部分内容阅读
近红外光谱技术是二十世纪90年代发展最快、最引人注目的光谱技术之一。因其具有分析速度快、样品前处理简单、操作简便、非破坏性以及不使用化学试剂等优点,加上近年来计算机科学、化学计量学理论和方法的不断发展与完善,近红外光谱技术越来越受到国内外学者的青睐,已广泛应用到食品、医药、石油化工等众多领域。本研究对江西、重庆和湖南三个产地的72个脐橙样品及119个橙汁样品,利用PertenDA7200型近红外光谱仪收集近红外光谱,通过平滑、一阶导数、二阶导数、矢量归一化、标准正态变量变换(SNV)等光谱预处理方法以及主成分分析(PCA)、簇类独立软模式法(SIMCA)和判别偏最小二乘法(PLS-DA)等数理统计方法建立了基于近红外光谱的柑桔产地判别和橙汁掺假识别定性分析模型。主要研究结果如下:1、针对江西、重庆和湖南三个产地的72个脐橙样品,建立了基于SIMCA模式识别法的柑桔产地溯源定性分析模型。原始光谱经过一阶导数(9点平滑)预处理,在1140-1170 nm波段范围,江西、重庆和湖南三个产地模型的主成分数为2时,采用SIMCA模式识别法建立柑桔产地溯源模型。在5%的显著水平下,三个产地模型对训练集样品的识别率均为100%,拒绝率分别为85.7%、83.3%、100%;对验证集样品的识别率均为100%,拒绝率分别为100%、89.5%、100%。表明建立的SIMCA模型能够达到区分柑桔产地来源的目的。2、对江西、重庆和湖南三个产地的脐橙样品分别赋值0、1、-1,建立了柑桔产地的PLS-DA模型。原始光谱不经过任何光谱预处理,在全波长范围950-1650 nm建立的模型效果最好,在主成分数为13时建立PLS-DA柑桔产地溯源模型,预测值与标准值的相关系数(R~2)为0.973,校正标准差(RMSEC)为0.109,预测标准差(RMSEP)为0.159,模型对训练集样品的预测值分别在-0.196-0.205、0.751-1.119、-1.151--0.867,对验证集样品的预测值分别在-0.441-0.368、0.652-1.063、-1.219--0.564,重庆样品预测最小值0.652大于江西样品预测最大值0.368,湖南样品预测最大值-0.564小于江西样品预测最小值-0.441,三类样品能明显区分开,模型对训练集和验证集样品的识别准确率达到100%。比较分析SIMCA模式识别法和PLS-DA法建立的柑桔产地溯源模型,发现PLS-DA模型比SIMCA模型的预测准确度更高,模型的稳定性能更好。3、对橙汁原汁赋值1,宽皮柑桔汁和柚汁赋值-1,建立区分橙汁原汁与宽皮柑桔汁和柚汁的PLS-DA模型。原始光谱经过SNV预处理,在950-1650 nm全波长范围,模型的预测效果最好,在主成分数为10的条件下,建立PLS-DA模型。模型的预测值与标准值的相关系数R2为0.991,RMSEC为0.0928,RMSEP为0.137,模型对训练集中橙汁原汁的预测值在0.880-1.208,宽皮柑桔汁和柚汁的预测值在-1.157~-0.787,对验证集样品的预测值分别为0.945-1.446和-1.395~-0.558,模型对训练集和验证集样品的识别准确率为100%。4、针对橙汁原汁和掺假橙汁样品,分别赋值1和-1,建立了基于PLS-DA法的橙汁掺假识别模型。原始光谱不经过任何预处理,在1340-1550 nm波段范围,在最佳主成分数为6的条件下,建立橙汁掺假识别的PLS-DA模型。模型的预测值与标准值的相关系数R2为0.985,RMSEC为0.0899,RMSEP为0.108,模型对训练集中橙汁原汁的预测值在0.745-1.145,对掺假橙汁的预测值在-1.162--0.763,对验证集样品的预测值分别在0.842-1.208和-1.126--0.780,两类样品以0为界限,分别分布在1和-1附近,模型对训练集和验证集样品的预测准确率为100%。