论文部分内容阅读
光谱技术获取土壤属性信息,结合机器学习算法对土壤养分进行回归分析成为研究热点,小样本预测分析常采用SVM算法,但基于径向基核函数SVM模型虽然很大程度上提高了预测效率,但预测精度偏低,如何提高模型预测精度成为研究热点。本文以山东省泰安市山东农业大学南校区试验站桑园为研究区域,按照五点采样原则采取地理位置跨度大的土壤样品。对风干过筛后的土壤样品进行可见-近红外光谱数据采集和土壤养分含量测定。随后采用蒙特卡罗算法剔除异常样本,对剔除异常样本后的光谱数据进行不同预处理,从中选择最优的预处理方法。为了去除冗余信息和提高运算速度,采用CARS、IRIV以及CARS-IRIV算法等5种算法进行特征变量选择。然后,采用回归预测模型对土壤养分进行预测,但由于传统的预测模型应用时会存在一定的局限性,必须将传统模型进行融合和优化。因此,本文采用混合核函数支持向量机回归模型,并引入鲸鱼优化算法(Whale optimization algorithm,WOA)对混合核支持向量机中的g(核函数参数)、c(惩罚因子)和k-rbf(权重系数)参数优化,构建基于鲸鱼优化算法的混合核函数支持向量机(RBF-poly-SVM)土壤养分预测模型。具体研究结果如下:(1)应用标准正态变换(SNV)、多元散射校正(MSC)、SG平滑、一阶导数、平方根、SG-平方-FD等方法对光谱数据进行预处理。结合PLSR进行最优预处理方法选择,结果表明土壤全氮的最优预处理方法为SG-平方-FD,全磷的最优预处理方法为平方-FD,全钾的最优预处理方法为平方根,速效氮的最优预处理方法为SNV-DT,有机质的最优预处理方法为SNV-DT。(2)由于传统预测模型具有局限性,本文采用径向基核函数与多项式核函数组成的混合核函数建立混合核SVM模型,同时建立径向基核SVM模型进行比较。采用鲸鱼优化算法(WOA)对两个预测模型中的核函数参数进行优化,提高模型的预测性能。试验对比发现,混合核SVM模型对土壤养分的最优预测结果均优于径向基核SVM模型。(3)基于改进SVM算法的土壤全氮、全磷、全钾含量预测,经过预处理后,采用CARS、IRIV、SPA、CARS-IRIV和VISSA-IRIV算法进行特征变量选择,将选择出的特征变量分别采用RBF-poly-SVM和RBF-SVM模型进行土壤养分预测。结果表明,土壤全氮以IRIV算法提取出的特征变量建立的RBF-poly-SVM模型预测结果最优,校正集决定系数Rc2为0.925,预测集决定系数Rp2为0.918,RPD值为3.198。土壤全磷以IRIV算法提取的特征变量建立的RBF-poly-SVM预测模型最优,校正集精度Rc2为0.999,预测集精度Rp2为0.937,RPD值为3.177。土壤全钾以VISSA-IRIV算法提取的特征变量建立的RBF-poly-SVM预测模型结果最优,校正集精度R2c为0.955,预测集精度Rp2为0.854,RPD值为2.608。RBF-poly-SVM预测模型与RBF-SVM模型相比匹配效果更好,精度得到提高。(4)基于改进SVM的土壤速效氮、有机质含量检测,光谱反射率经过预处理和特征变量选择后,分别建立RBF-poly-SVM和RBF-SVM预测模型。结果表明,土壤速效氮以IRIV算法提取的特征变量建立的RBF-poly-SVM预测模型结果最优,校正集决定系数Rc2为0.913,预测集决定系数Rp2为0.845,RPD值为2.268。土壤有机质以IRIV算法提取的特征变量建立的RBF-poly-SVM预测模型最优,校正集决定系数Rc2为0.962,预测集决定系数Rp2为0.912,RPD值为3.075。