论文部分内容阅读
在小麦籽粒选种、面粉加工、市场交易、储藏等领域,如何快速有效得到某种类型小麦的品质信息具有非常重要的现实意义。目前获得的小麦的品质信息方法多采用化学法、X光扫描等方法,但是存在实验设备昂贵、实验周期过长等弊端。小麦蛋白质的含量作为小麦品质信息主要的表示信息,论文采用近红外光谱技术对小麦蛋白质含量信息进行评价分析,从而降低检测小麦品质信息的成本和处理时间,提高其检测的适用性和准确性。论文的具体研究内容如下:(1)光谱数据预处理。在对小麦籽粒进行光谱的扫描的过程中,存在内部因素(仪器)和外部因素(光照、温度等)对光谱数据产生负面的影响,因此扫描得到的近红外光谱数据中存在部分的干扰信息。如果把引入的干扰信息作为波长信息变量进行建模分析势必会影响建立模型的稳定性和预测性,故需要对小麦籽粒近红外光谱数据进行预处理,尽可能的减小内部因素和外部因素对光谱数据的影响。论文分别采用归一化(Normalize)、一阶导数(1st Derivative)、二阶导数(2st Derivative)、平滑(Smoothing)、标准正态(SNV)、多元散射(MSC)、基线(Baseline)、去趋势(Detrend)不同组合方法对光谱数据进行预处理,提出的Smoothing+1st Derivative+SNV组合方法对小麦光谱数据进行预处理得到的效果最佳。(2)提取特征波长。经近红外光谱仪扫描小麦籽粒得到的光谱数据,由于得到的光谱维度高,存在的波长信息变量多。如果用全光谱数据信息变量进行建立模型分析,虽然可以很好的得到性能良好的模型,但是提取的光谱数据中不仅存在有效的信息变量,还存在无信息和干扰信息变量。如果可以提取出光谱数据中存在的特征波长信息变量,从而剔除存在的无信息和干扰信息变量,建立模型的稳定性和预测性会得到提高。针对本论文的研究对象,提出了基于迭代保留信息变量算法(IRIV)和竞争自适应重加权算法(CARS)的小麦籽粒光谱数据特征波长提取方法,IRIV算法和CARS算法分别选择和提取了30个和28个特征波长。(3)不同模型对比分析。为了合理突出样本数据广泛适用性,用联合X-Y距离的样本集划分算法(SPXY)对281个小麦籽粒样本光谱数据进行划分,划分校正集小麦籽粒样本和预测集小麦籽粒样本。提出了基于偏最小二乘算法(PLSR)、极限学习机神经网络(ELM)、径向基神经网络(RBF)、BP神经网络(BP)四种算法对未经处理和处理后的对小麦籽粒光谱数据进行建模分析。用经SPXY算法划分得到的71个验证集样本数据对模型进行验证分析,提出的基于Smoothing-1st Derivative-SNV-IRIV-PLSR组合算法建立模型的预测性与稳定性最高,预测集均方根误差为0.1572,决定系数为0.9895。