论文部分内容阅读
随着科学技术的不断发展,由于近红外光谱分析技术不需样品预处理、能定性定量检测分析气体、液态和固态样品等独特优势,已成为环境监测、食品安全、石油化工和国防等领域的一种质量控制、品质分析和在线分析的非接触无损检测的重要手段。
近红外光谱校正模型建立与波长选择是近红外光谱信息处理的两个核心问题,本论文以重庆大学微系统研究中心研制的MSNIR-1微型近红外光谱仪为具体应用对象,针对近红外光谱校正模型建立和波长选择中存在的若干问题开展研究,具有重要的理论意义和实用价值。论文的主要研究工作是:
1.以物质近红外光谱的产生及特点为切入点,研究了近红外光谱信息处理中的关键问题,深入探讨了现有近红外光谱校正模型建立方法和光谱波长选择方法,以及存在的问题。
2.针对光谱与物质的成分或性质之间的非线性关系问题,研究了流形学习的相关理论,基于流形学习的思想和局部加权回归(LWR)模型,提出了一种近红外光谱校正模型建立方法。根据物质在近红外区域的吸收特性,该方法假设具有不同成分或性质的同一类物质,其近红外光谱可嵌入到一个低维流形,且该低维流形是局部线性的,采用流形学习中的局部线性嵌入(LLE)方法自适应地计算LWR的权重系数,建立校正模型。研究结果表明,该方法模型简单、计算量小,对于线性或非线性关系,都能得到比较准确的预测结果。
3.根据正交信号校正(OSC)与偏最小二乘(PLS)之间的互补关系,提出了一种基于正交信号校正的波长选择方法。该方法用直接正交信号校正(DOSC)的权重向量来度量波长点的“不重要”性,进行波长选择。实验结果表明,该方法只选择了部分波长点参与建立模型,提高了模型的预测能力,且算法简单、计算量小。
4.针对单个模型的信息不一定能准确反映波长点重要性的问题,提出了基于多模型融合和基于Monte Carlo方法的两种波长选择方法。基于多模型融合的波长选择方法是通过融合多个PLS模型的回归系数,得到一个更加准确的波长点重要性评估向量,确定阈值,选择所有大于阈值的波长点。该方法的主要特点是融合了多个模型的信息,能更加准确地度量波长点的重要性。基于Monte Carlo的波长选择方法是根据PLS回归系数作为衡量波长点重要性最有效的指标之一,将PLS回归系数归一化成为对应波长点被选择的概率,并进行Monte Carlo随机模拟,即对不同的随机波长点组合建立一系列PLS模型,选择预测误差最小的模型所对应的波长点组合。这个过程可以在前一次波长选择的基础上重复进行,形成迭代算法。通过Monte Carlo随机模拟,该方法克服了单个PLS模型的回归系数对于波长点重要性的不准确度量。
5.在研究各种波长选择方法过程中,发现被选择的波长点只占全部波长点很小的比例,表明波长选择具有稀疏性,基于这一特性,提出一种将波长选择问题转化为稀疏优化问题的波长选择方法。该方法以选择最少的波长点为优化目标,以光谱与物质的成分或性质数据之间的关系为约束条件,将获得对物质的成分或性质有贡献、且个数最少的波长点。实验结果表明,该方法不仅选择了最少的波长点,且减少了校正模型的预测误差。
6.针对MSNIR-1微型近红外光谱仪的实用化要求,根据近红外光谱信息处理方法的特点,基于插件设计思想设计开发MSNIR-1专用光谱分析软件,并进行相关的测试。测试结果表明,该软件能正确地采集光谱数据,并进行光谱分析,分析结果可靠,初步满足了MSNIR-1微型近红外光谱仪的实用化要求。