论文部分内容阅读
仪器的发展使矩阵形式的二维测量数据在分析化学中渐成主流,如GC-MS数据,HPLC-DAD数据等,或者一系列一维测量数据的组合。这种数据包含了丰富的化学信息,但是也存在诸多干扰和冗余,导致了数据解析方面的困难。数据解析的关键在于去除冗余,提取主要信息,即对数据矩阵进行“降维”(dimensionality reduction)。降维的重要结果之一就是信息主要贡献者的数目—主因子数(number of primary/significant factors)。复杂化学体系的数据解析中,估计主因子数是一个必要步骤,同时也是一个难题。目前存在多种各具特点的估计方法。对这些方法进行整理和归纳可以为这一难题提供全局视角下的综合性信息,有助于进一步研究。本文详细阐述了新的分类思路,新是指从数学角度归纳出数学原理完备的估计方法,从新的视角分析了这类方法的共性,并将这类方法分为两小类。具体工作分为三方面:1.现存主因子数估计方法的基本原理,结合对实验模拟数据的计算情况,详细分析各方法的判断标准。根据对各方法的深入分析,把它们分别归纳为经验估计方法、数学原理完备的估计方法和统计方法三类,并对各类方法的特征进行总结。其中数学原理完备的估计方法是本文归纳的一个创新点。2.各方法的应用,即使用上述一些实用性较强的方法对模拟数据和实验数据进行主因子数的估计,并模拟分析了微量组分、色谱重叠程度和噪声水平的极限情况,为各种方法能承受的极限能力提供参考。比较实验数据主因子数的预期范围和预测结果,可以观察各方法的预测效果。比较各方法的应用结果,并不是为了得出各方法孰优孰劣的结论,而是为了在实际应用中,根据不同情况,有选择地运用一些合适方法,以更准确地实现主因子数的估计。3.使用拉曼光谱仪测量得到氯化锶水合物-溶剂(水或甲醇)的拉曼光谱数据,结合各样品的浓度组成浓度-拉曼光谱的二维数据。采用上述化学计量学方法对该数据进行主因子数的估计,来预测氯化锶水合物与溶剂间是否发生溶剂化作用,同时更好地检测各方法的估计效果。