论文部分内容阅读
近红外光谱技术由于其快速、准确、检测成本低等优点,已成为烟草行业的研究热点。但烟叶属天然复杂产物,其漫反射光谱不但包含了样品的物理和化学信息,还承载了仪器类型、环境参数等多方面复杂的背景信息,光谱的多元性使其近红外定量模型受外界条件影响大、适应性差、网络化中心建模无法成功推广。针对这一问题,本文从近红外光谱分析的基本理论入手,对如何建立预测精度高、稳健性好的烟叶近红外通用定量模型的影响因素进行了分析研究,重点围绕着光谱采集稳定性、稳健数学模型的建立、模型转移和网络化中心建模等几个关键技术点进行了系统的研究并提出改进措施。主要研究内容如下:(1)针对烟叶样品采集过程中光谱不稳定性问题,从理论上对采集过程的误差特征进行了分析,同时对各种来自于样品、操作、设备等方面的误差进行了分析和探讨。实验表明这些因素都会对光谱采集的不稳定性带来影响,引起分析误差的产生。实际应用中可采用如下措施对烟叶光谱采集的稳定性进行控制:样品方面:样品粒度应控制在40目以上,且粒度越小,光谱采集的波动性越小;样品温度在5-25℃范围内相对对光谱的波动性影响较小;水分对烟叶近红外光谱影响较大,实际应用应尽量将水分控制在4-8%范围以内,并且保证待测样品水分含量尽量与校正集样品水分含量范围一致。操作方面:可采用压样措施减小光谱采集过程中的误差;样品不均匀性的影响可采用样品杯旋转功能来降低,同时还应注意样品制备时要将样品充分混合均匀;实验发现平均装样误差大约占总体误差的30%,为减少装样误差的影响,在进行样品光谱采集时应对相关人员进行一定的操作培训,建议控制操作人员的装样误差小于1/3SEP。仪器方面:研究发现,分辨率的提高并不能完全改善模型的性能,对于烟草样品实际应用中8cm-1分辨率最能满足实际需求;波长漂移对烟叶样品预测结果影响较大,实际应用中要经常使用标准物质对波长的准确性进行校正;开机时间的长短对光谱采集的稳定性也有影响,开机时间太短,仪器不稳定,会导致采集的光谱及预测结果的不稳定,实际应用时,建议仪器开机至少1h后才能进行光谱的采集。(2)针对如何建立一个稳健、可靠、准确的数学模型,从理论和实际应用方面对模型建立过程中如何充分提取光谱中有效信息,降低背景信息的干扰等一系列问题进行了研究,并从校正集样本的选取、波长选择、模型补偿等方面对模型稳健性的影响进行了探讨。校正样本集选取方面:对比了人工选取、主成分空间、GH-NH、K-S等几种校正集样本的选择方法,研究发现GH-NH距离法无论是从样品浓度覆盖范围还是建模效果方面,其样本选择都是最优的,实际应用中可以将GH-NH法与人工挑选相结合,将是挑选代表性样本的最佳方法。波长选择方面:提出一种新的基于随机森林重要性评分(RFFIM)和主成分分析(PCA)的波长选择方法RFFIM-PCA,该方法可以有效剔除光谱中噪声和冗余信息的干扰,选出和待测组分密切相关且对外界变化不敏感的波长区域,模型具有高的稳健性和准确性。模型补偿方面:研究了高水分含量烟叶样品的模型补偿和修正,发现加入3个不同水分含量的样本即可实现较好的补偿效果。(3)针对提高模型的通用性和适应性问题,对一些模型转移算法进行了研究,提出了烟叶样品模型转移必要性判断标准及转移评价标准。对两台不同仪器之间模型转移问题,提出一种结合RFFIM波长选择和Shenk’s算法的模型转移算法RFFIM-Shenk’s,并和S/B、DS、PDS、Shenk’s等算法进行了对比,取得了较好的转移效果。对烟片、烟末不同样品状态的之间的模型转移效果不是太理想,提出一种混合建模策略,研究发现在已有的烟末模型样品集基础上加入10%左右的新样品,即可达到较满意的效果。(4)针对目前烟草行业近红外应用主要以单台仪器为主,网络化中心建模无法成功推广的现状,提出了烟叶品质快速分析网络平台的构建方式,并对其基本网络体系的架构、烟叶品质数据库、光谱库的构建、云计算服务平台搭建等进行了设计与分析。