论文部分内容阅读
红枣富含多种营养成分,具有很高的食用和药用价值。由于生长环境、成熟度、树龄等因素的影响,检测模型的精度不理想、处理速度较慢、算法的可靠性和稳定性不高、不同仪器所建检测模型难以共享的问题普遍存在。为此,本研究以壶瓶枣为研究对象,利用可见/近红外光谱技术、高光谱成像技术、化学计量学、数据挖掘技术等进行可溶性固形物(soluble solids content,SSC)和维生素C含量(vitamin c content,VC)的检测研究,以提高检测模型的精度和稳定,并实现多指标同步检测。主要研究内容和结论如下:(1)为实现不同成熟阶段的鲜枣SSC检测,利用近红外高光谱成像技术,采用网格寻优(grid-search,GS)的最小二乘支持向量机(least square-support vector machines,LS-SVM)建立4个成熟阶段联合数据的校正模型,预测集的决定系数(determination coefficient,Rp2)、均方根误差(root-mean-square error,RMSEP)、相对分析误差(residual predictive deviation,RPD)分别为0.98,1.10%和7.85。然后,采用连续投影算法(Successive projuctions algorithm,SPA)提取联合变量的特征波长,采用人工蜂群(artificial bee colony,ABC)算法改进SPA-LS-SVM模型,预测结果(Rp2=0.98,RMSEP=1.19%,RPD=7.25)明显好于SPA-GS-LS-SVM模型(Rp2=0.96,RMSEP=1.24%,RPD=6.96)。最后,利用ABC-SPA-LS-SVM校正模型建立SSC可视化分布图,清晰地表明在成熟过程中SSC逐渐增加。研究表明构建多成熟阶段的检测模型更具有现实意义,ABC增强了校正模型的预测能力,高光谱成像技术和ABC算法在农产品检测中具有好的应用价值和潜力。(2)为解决不同仪器所建检测模型难以共享的难题,基于可见/近红外光谱技术采用LS-SVM建立鲜枣SSC检测模型,利用专利算法(Shenk’s)、直接标准化(Direct standardization,DS)、斜率/偏差算法(Slope/bias,S/B)进行模型传递。然后,根据回归系数提取主仪器(24个)和从仪器(28)的特征波长,优选出单一变量(SV)24个、共性变量(CV)23个、融合变量(FV)29个,均涵盖了SSC的主要吸收谱带。利用优选的变量分别建立主仪器的LS-SVM检测模型,对主仪器的预测结果(Rp2=0.780.80,RMSEP=1.07%1.13%)明显好于全波段所建模型(Rp2=0.73,RMSEP=1.36%),但预测从仪器时RMSEP为6.62%7.88%,结果较差。(3)基于波长位置偏移和分子振动的吸收特性提出了共性变量优选结合差值补正(CV-MC)、SV-MC、FV-MC、共性变量优选结合波长补正算法(CV-WC)进行模型传递,并与SV-Shenk’s、CV-Shenk’s、FV-Shenk’s、SV-DS、CV-DS、FV-DS、SV-S/B、CV-S/B、FV-S/B进行对比分析。结果表明,基于全波段进行模型传递时,预测结果均较差(Rp2=0.030.34,RMSEP=2.44%4.67%);基于优选变量所建模型经SV-Shenk’s、CV-Shenk’s、FV-Shenk’s传递后的结果较差,经其它算法传递后的结果(Rp2=0.470.73,RMSEP=1.30%1.90%)好于全波段;基于共性变量传递后的结果好于单一变量和融合变量,CV-MC结果最佳(Rp2=0.73,RMSEP=1.30%),CV-WC传递后的预测结果(RMSEP=1.62%)与CV-DS和CV-S/B相近。研究表明,CV-MC和CV-WC均是一种有效模型传递算法,对建立不同仪器间通用的鲜枣品质检测模型具有重要意义。(4)为探究栽培模式对检测模型的影响,在450780nm(Vis)、7801100nm(SW-NIR)、11002400nm(LW-NIR)、7802400nm(NIR)、4502400nm(Vis/NIR)波段范围内分别建立了SSC检测模型,Vis和LW-NIR波段所建模型的预测结果不理想。SW-NIR、NIR和Vis/NIR范围内所建模型均对相同栽培条件下鲜枣的预测得到较好的预测结果。预测其它条件鲜枣时,露地鲜枣在4502400nm所建模型预测防雨棚验证集样本的Rv2为0.73,RMSEV为1.51%,RPD为1.93,好于其它模型(Rv2=0.420.74,RMSEV=1.74%2.70%,RPD=1.011.57)的预测结果。分别采用RC、CARS、F-CARS、R-CARS、RF、SPA提取特征波长,预测露地鲜枣时RC-PLSR模型结果最好,Rv2为0.83,RMSEV为1.17%,RPD为2.33;预测防雨棚鲜枣时,F-CARS-PLSR模型(Rv2=0.71,RMSEV=1.70%,RPD=1.84)预测结果好于其它5种方法所建模型(Rv2=0.640.71,RMSEV=1.79%2.11%,RPD=1.381.63),预测结果均不够理想。研究表明,栽培模式对SSC检测模型存在一定影响。(5)基于RC提取的特征波长,采用KS算法添加样本的模型更新方法进行露地和防雨棚鲜枣同步检测模型的优化,防雨棚验证集样本的Rv2由更新前的0.70提高到0.80,RMSEV由更新前的1.85%降低到1.32%,RPD由更新前的1.58提高到2.21,好于全波段更新后的验证结果(防雨棚验证集样本的Rv2为0.79,RMSEV为1.36%,RPD为2.15)。(6)为探究树龄对检测模型的影响,采用PLS建立不同栽培条件不同树龄鲜枣SSC检测模型,单一树龄所建模型对其它树龄样本的预测能力较差,单一栽培条件单一树龄所建模型预测其它栽培条件其它树龄样本的结果差于预测相同栽培条件其它树龄样本的结果。2种树龄联合后所建模型比单一树龄所建模型对其它树龄样本预测的结果稍好。3种树龄样本联合后所建模型对不同树龄样本的预测能力(Rp2=0.700.78,RMSEP=1.11%1.42%,Rv2=0.76,RMSEV=1.40%)好于2种和单一树龄所建模型,实现了对不同树龄样本的预测。研究表明,树龄是影响校正模型性能的一个因素。(7)为实现不同栽培条件不同树龄鲜枣的SSC和VC同步检测,利用RC、SPA、F-CARS、R-CARS、R-CARS-SPA、F-CARS-SPA提取SSC和VC的特征波长,并分别建立PLS和LS-SVM检测模型,进行SSC和VC的特征波长优选和波长融合。由于SSC和VC的特征波长间存在相同和相近的波长,结合波长位置偏移剔除涵盖相同信息的波长提取新的特征波长;在不同方法融合后的特征波长间优选共有波长和融合波长,采用LS-SVM建立检测模型。结果表明,融合波长适度增加了样本的有效信息,在一定程度上提高了模型的预测性能,预测结果好于其它方法所建模型,SSC的Rp2为0.78,RMSEP为1.17%;VC的Rp2为0.80,RMSEP为0.29mg.g-1,独立验证集SSC的Rv2和RMSEV分别为0.80和1.29%,独立验证集VC的Rv2和RMSEV分别为0.81和0.27mg.g-1,实现了对SSC和VC的同步检测,为不同条件下鲜枣内部多指标同步检测的实现和检测模型普适性的提高提供了一定的理论和方法支持。