论文部分内容阅读
摘 要:利用傅立叶变换红外光谱(FTIR)结合衰减全反射(ATR)技术和单点回归方法建立人体血液血红蛋白定量分析的数学模型。以预测均方根偏差(RMSEP)和预测相关系数(RP)为目标进行模型优选。结果表明:最优单点模型的RMSEP、RP值分别达到5.40、0.859,为FTIR/ATR光谱技术应用于人体血红蛋白的定量分析提供优秀稳定的数学模型。
关键词:血红蛋白 FTIR/ATR光谱 数学模型
中图分类号:O657 文献标识码:A 文章编号:1674-098X(2011)01(b)-0214-02
利用傅立叶变换红外光谱(FTIR)结合衰减全反射(ATR)技术(简称FTIR/ATR技术)分析某种待测量前必须先建立数学模型(关联样品光谱与待测量之间的数学关系),才能依据样品的光谱通过数学模型确定待测量。因此FTIR/ATR光谱分析的关键是建立优秀的数学模型,本文采用一元线性回归方程建立血液血红蛋白FTIR/ATR光谱分析的定标预测模型,本质上是对数学模型的优化过程,目标是为了寻找优秀的数学模型。为将FTIR/ATR光谱技术应用于人体血液血红蛋白快速定量测定提供优秀的定量分析的数学模型。
1 FTIR/ATR光谱分析的框架
FTIR/ATR光谱分析是利用关联算法将已知样品的光谱数据与参考化学值相关联,建立定量或定性分析的数学模型,然后根据模型和未知样品的光谱预测未知样品的组成或性质,是一种间接测量技术。如图1所示。因此,在测定样品中某待测量前,必须首先建立相应的数学模型。
数学模型的建立具体可以分为定标和预测两个过程。定标过程是选择一批有代表性的样品作为定标样品集,分别用现行标准或传统方法进行准确测定其FTIR/ATR光谱与各种待测量(称为参考化学值),得到二维光谱矩阵与对应的二维化学值矩阵(预测样品的FTIR/ATR光谱和参考化学值亦同样取得)。然后以此作为建模数据,运用化学计量学方法,建立光谱数据与参考化学值之间的关系式即定标模型(结合光谱预处理等);预测过程就是将预测样品成分浓度的光谱数据代入定标过程求得的公式,计算预测样品的成分含量(预测值)。然后,将预测集样品的预测值与参考化学值比较,根据模型评价指标来确定预测精度。
2 实验部分
本实验的样品是广州市某研究所提供的人体全血样品119个。所提供的119个人体血液样品的血红蛋白浓度是由传统BC-3000Plus全自动血液细胞分析仪测定的,作为光谱定标的参考化学值。样品的血红蛋白浓度最大值为86.5g/L、最小值为42.5 g/L、平均值为67.2g/L、标准偏差为7.19 g/L。用蒸馏水溶血,每个样品都配置成2倍的溶血液样品用于光谱测定。
本实验仪器是采用BRUKER公司的VERTEX 70型傅里叶变换红外光谱仪(FTIR),选用SPECAC公司的水平衰减全反射(简称ATR附件)样品测量附件。水平ATR的样品槽为ZnSe晶体,45°入射角,3次反射。测量谱段在4000~600cm-1(共有1762个波数点),用衰减全反射方式获得119个人体溶血液样品的FTIR/ATR吸收光谱。每个样品重复采集3次光谱,计算平均光谱。
3 单点回归模型的优选
单点回归模型是只用一个光谱数据点和相应的化学值的线性关系建立光谱的回归模型。本文大约按照定标集和预测集2∶1的比例来划分这119个溶血液样品。定标集预测集的样品数分别设定为78、41个。建立每个波数点的定标预测模型,以RMSEP和RP为优化目标,筛选最优的单点模型。
首先,对定标集中的样品在1762个波数点处建立一元浓度定标方程作为数学模型(定标模型),共有1762个模型。设分别为第个样品在第个光谱点的吸光度,其血红蛋白的浓度,则有:
其中i为定标样品的个数。通过定标模型算出每个波数点处的回归系数,然后将每个预测样品在每一个波数点处的吸光度和回归系数代回相应的回归方程反算出浓度,即得到41个预测样品在1762个波数点处的所有预测值()。
将每一个预测样品的参考化学值和在每一个波数点处的预测值代入预测均方根偏差(RMSEP)和预测相关系数(RP)公式,得到所有数学模型的预测效果的RMSEP和RP
其中为预测集中第i样品的化学值;预测集中第i个样品预测值;预测集中化学值的平均值;预测集中预测值的平均值;n为定标集的样品数;m为预测集的样品数。
以预测均方根偏差(RMSEP)和预测相关系数(RP)为目标,进行模型参数的联合优化设计,经过计算机数值实验,在大范围内进行模型优选,一方面使得RP尽可能大,一方面使得RMSEP尽可能小。经筛选得出在1543cm-1附近,RMSEP比较低为5.40,而RP的相关系数比较高为0.859,如图2所示。说明在1543cm-1处有良好且稳定的预测效果。该波数点处的模型为最优单点模型。
参考文献
[1] 曹干,谭中文,等.甘蔗蔗汁锤度和还原糖分傅立叶变换近红外定量分析数学模型[J].华南农业大学学报.2004,25(2):1-4.
[2] 严衍禄.近红外光谱分析基础与应用[M].北京:中国轻工业出版社.2005.
关键词:血红蛋白 FTIR/ATR光谱 数学模型
中图分类号:O657 文献标识码:A 文章编号:1674-098X(2011)01(b)-0214-02
利用傅立叶变换红外光谱(FTIR)结合衰减全反射(ATR)技术(简称FTIR/ATR技术)分析某种待测量前必须先建立数学模型(关联样品光谱与待测量之间的数学关系),才能依据样品的光谱通过数学模型确定待测量。因此FTIR/ATR光谱分析的关键是建立优秀的数学模型,本文采用一元线性回归方程建立血液血红蛋白FTIR/ATR光谱分析的定标预测模型,本质上是对数学模型的优化过程,目标是为了寻找优秀的数学模型。为将FTIR/ATR光谱技术应用于人体血液血红蛋白快速定量测定提供优秀的定量分析的数学模型。
1 FTIR/ATR光谱分析的框架
FTIR/ATR光谱分析是利用关联算法将已知样品的光谱数据与参考化学值相关联,建立定量或定性分析的数学模型,然后根据模型和未知样品的光谱预测未知样品的组成或性质,是一种间接测量技术。如图1所示。因此,在测定样品中某待测量前,必须首先建立相应的数学模型。
数学模型的建立具体可以分为定标和预测两个过程。定标过程是选择一批有代表性的样品作为定标样品集,分别用现行标准或传统方法进行准确测定其FTIR/ATR光谱与各种待测量(称为参考化学值),得到二维光谱矩阵与对应的二维化学值矩阵(预测样品的FTIR/ATR光谱和参考化学值亦同样取得)。然后以此作为建模数据,运用化学计量学方法,建立光谱数据与参考化学值之间的关系式即定标模型(结合光谱预处理等);预测过程就是将预测样品成分浓度的光谱数据代入定标过程求得的公式,计算预测样品的成分含量(预测值)。然后,将预测集样品的预测值与参考化学值比较,根据模型评价指标来确定预测精度。
2 实验部分
本实验的样品是广州市某研究所提供的人体全血样品119个。所提供的119个人体血液样品的血红蛋白浓度是由传统BC-3000Plus全自动血液细胞分析仪测定的,作为光谱定标的参考化学值。样品的血红蛋白浓度最大值为86.5g/L、最小值为42.5 g/L、平均值为67.2g/L、标准偏差为7.19 g/L。用蒸馏水溶血,每个样品都配置成2倍的溶血液样品用于光谱测定。
本实验仪器是采用BRUKER公司的VERTEX 70型傅里叶变换红外光谱仪(FTIR),选用SPECAC公司的水平衰减全反射(简称ATR附件)样品测量附件。水平ATR的样品槽为ZnSe晶体,45°入射角,3次反射。测量谱段在4000~600cm-1(共有1762个波数点),用衰减全反射方式获得119个人体溶血液样品的FTIR/ATR吸收光谱。每个样品重复采集3次光谱,计算平均光谱。
3 单点回归模型的优选
单点回归模型是只用一个光谱数据点和相应的化学值的线性关系建立光谱的回归模型。本文大约按照定标集和预测集2∶1的比例来划分这119个溶血液样品。定标集预测集的样品数分别设定为78、41个。建立每个波数点的定标预测模型,以RMSEP和RP为优化目标,筛选最优的单点模型。
首先,对定标集中的样品在1762个波数点处建立一元浓度定标方程作为数学模型(定标模型),共有1762个模型。设分别为第个样品在第个光谱点的吸光度,其血红蛋白的浓度,则有:
其中i为定标样品的个数。通过定标模型算出每个波数点处的回归系数,然后将每个预测样品在每一个波数点处的吸光度和回归系数代回相应的回归方程反算出浓度,即得到41个预测样品在1762个波数点处的所有预测值()。
将每一个预测样品的参考化学值和在每一个波数点处的预测值代入预测均方根偏差(RMSEP)和预测相关系数(RP)公式,得到所有数学模型的预测效果的RMSEP和RP
其中为预测集中第i样品的化学值;预测集中第i个样品预测值;预测集中化学值的平均值;预测集中预测值的平均值;n为定标集的样品数;m为预测集的样品数。
以预测均方根偏差(RMSEP)和预测相关系数(RP)为目标,进行模型参数的联合优化设计,经过计算机数值实验,在大范围内进行模型优选,一方面使得RP尽可能大,一方面使得RMSEP尽可能小。经筛选得出在1543cm-1附近,RMSEP比较低为5.40,而RP的相关系数比较高为0.859,如图2所示。说明在1543cm-1处有良好且稳定的预测效果。该波数点处的模型为最优单点模型。
参考文献
[1] 曹干,谭中文,等.甘蔗蔗汁锤度和还原糖分傅立叶变换近红外定量分析数学模型[J].华南农业大学学报.2004,25(2):1-4.
[2] 严衍禄.近红外光谱分析基础与应用[M].北京:中国轻工业出版社.2005.