样本集选择对近红外定量分析模型稳健性影响研究

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:zhl165408
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在近红外定量分析中,样本集选择是影响模型稳健性的关键因素之一,它直接影响着模型的预测能力和适应性。样本集选择方法可分为常规选择和计算机识别两种。常规选择通常需要大量的样本积累和化学测定,耗费大量的人力物力,而现有的计算机识别方法则需要复杂的编程和人为界定中间参数,从而限定方法进一步推广应用。 本文提出了仅依靠光谱数据第一主成分得分或综合主成分得分进行样本优选的新方法,分别简称为综合主成分法和单主成分法。本文借助通用的商业软件SPSS对418个烟草样本光谱进行主成分分析,利用提取的光谱主成分得分信息优选出约105个样本(备选样本总体的1/4)的校正样本集,并与随机法、含量梯度法的优选性能进行了对比。实际建模验证表明,本文提出的方法既克服了随机法挑选样本代表性不足的风险,又可避免含量梯度法必须测定所有样本成分含量而造成的人力物力消耗,具有无需编程、操作简单、易于推广的特点。 校正集样本的数量是影响模型稳健性的重要因素,也直接决定着模型构建时工作量的大小。本文使用含量梯度法从418个烟草样本中分别均匀选取53个、105个、209个、314个、418个样本作为校正集,并进行实际建模验证,通过决定系数(R<2>)、校正标准差(SEE)、预测标准差(SEP)以及外部验证集检验评价各模型的性能,探讨了校正集样本数量对模型稳健性的影响。 本文主要研究内容如下: 1.分别使用随机法、含量梯度法对418个烟草样本进行选择,得到包含约四分之一样本的校正样本集,通过烟碱成分实际建模验证研究两种方法对模型稳健性的影响。 2.分别使用全谱数据和有限光谱数据进行主成分分析,采用单主成分法、综合主成分法对418个烟草样本进行优选,得到包含约四分之一样本的校正样本集,通过烟碱成分实际建模验证研究两种方法对模型稳健性的影响。 3.使用含量梯度法从418个烟草样本中选取不同数量样本作为校正集,通过烟碱成分实际建模验证探讨了校正集样本数量对模型稳健性的影响。
其他文献
现有的新型功能磁性材料的研究,已经难以满足与日俱增的应用需求。Dy(Ⅲ)离子分子磁体具有显著磁各向异性和高自旋反转能垒,能在分子水平上应用于纳米级电子器件、传感器和高
金属有机骨架配合物(MOFs)有着比表面积大、孔隙率高、化学结构及孔径可调性、化学可修饰性等优点,目前该类材料已成功应用于气体吸附领域,但在放射性核素吸附方面极少报道。本文采用偶氮苯-4,4’-二羧酸为配体,结合不同链长的酰胺成功合成了官能团相同但碳骨架链长不同的三种偶氮型光敏MOFs材料,并将其作为吸附剂进行了放射性铀离子的吸附性研究,其主要工作如下:(1)选偶氮苯-4,4’-二羧酸与硝酸锌为原
将分子识别转化为高灵敏、易检测的光学信号的光学分子传感器是“分子识别”研究在分析科学新的发展需求下的一种应用形式。由于它在环境或生物微观系统的组织和结构探索方面
本文以HDI、IPDI、PBA、DMPA为主要原料采用丙酮法合成了适用于鞋材粘合的DMPA型水性聚氨酯分散液;为进一步提高稳定性,采用二氨基苯磺酸钠作为亲水单体制备了磺酸型WPU,还设计
配位聚合物和多核配合物因它们的结构新颖多变,性质独特,在非线性光学材料、磁性材料、超导材料、催化、生物模拟及吸附和分离等到诸多方面有着不可估量的应用前景而倍受关注。
室温离子液体的研究是近年来研究的热门课题之一。由于绿色化学的兴起所带来的历史性机遇及产业结构调整对传统材料和生产过程提出的挑战,使离子液体的研究迅速崛起并已在化学