论文部分内容阅读
随着时代的进步和科技的日新月异,特别是近红外光谱仪器的制造技术的提高,近红外光谱(NIRS)分析技术得到迅速发展。在石油、烟草、水质、医药等行业的产品质量监控过程中,近红外光谱分析技术的应用大大缩短了检测时间,提高了工作效率。然而,与传统的化学分析方法相比,利用近红外光谱分析技术建立定量模型的方法还存在一定的误差,预测准确率亟待提高。在近红外光谱定量建模分析过程中,影响分析结果准确性的因素有很多,例如近红外光谱仪器类型、测试样品形态、扫描环境、波长选择范围、建模算法的选择、校正样本选择及奇异样本的干扰等因素。其中,建模算法的优劣直接决定了分析结果是否准确,而校正集样品的组成及其基础数据测量的准确性决定了校正模型的适用性和准确性。因此,在近红外光谱定量建模技术中,建模算法的选择、校正集中奇异样本的剔除成为当今学者研究的热点问题。为了进一步提高质量检测的准确率,解决上述发现的热点问题,本文首先从近红外光谱数据的特征入手,围绕校正集中奇异样本的识别方法和定量建模算法两个方面的关键技术进行深入研究。本文的主要研究内容如下:1)描述了本文的研究背景及意义,并从奇异样本识别算法和定量建模算法两个方面分析了近红外光谱定量建模技术的研究现状,为后文指明了研究方向。2)介绍了近红外光谱分析的理化基础和一般流程,阐述了常用的近红外奇异样本识别方法和定量建模算法及模型评价方法,为后文的对近红外奇异样本识别方法和定量建模算法两个方面的优化研究提供了基础参考。3)针对校正集中的多奇异样本识别准确率低的问题,分析了校正集中常用的近红外奇异样本识别方法的不足。为了提高多奇异样本识别准确率,在杠杆值方法的基础上改进了杠杆值的计算策略,在一定程度上减少了对数据重心的依赖,拉开了奇异样本与正常样本的距离。另外,为了避免人工根据经验设定阈值的不合理性,结合改进的杠杆值,引入统计学领域中跳跃度的概念,提出了基于自动阈值判别的杠杆值改进算法。通过理论分析和实验对比法(与马氏距离、杠杆值-光谱残差法进行定量建模对比)验证了改进后的算法的有效性,为后续章节的定量建模提供了校正集数据质量的保障。4)针对近红外定量建模中光谱的变量属性与物质浓度(含量)之间的非线性问题,偏最小二乘法(PLS)和人工神经网络(ANN)方法都不能得到满意结果。本文借鉴前人的研究成果,对PLS进行了优化,增加ANN建立的残差模型部分,提出了偏最小二乘残差神经网络(PLS-RNN)建模算法。重点使用PLS-RNN对存在非线性问题的近红外光谱进行定量建模研究,并分别通过理论和实验对比了PLS-RNN和PLS、PCA-ANN的建模效果。结果表明,PLS-RNN在解决非线性问题时一定程度上优于PLS和PCA-ANN,但对于参数设计问题还需进一步的研究。5)总结了本文的创新性,并针对本文的不足之处,为今后的研究方向和研究重点做了展望。