论文部分内容阅读
血红蛋白浓度是临床医学诊断贫血及其他血液疾病的一项重要指标。临床医学采用生化分析手段检测患者的血红蛋白浓度,但是生化分析检查费用高,有创口,增加了患者感染的风险,而且不能连续监测。近红外光谱技术作为一种新兴的检测技术具有无创和连续测量等优点,在血红蛋白无创检测应用中取得了一定的进展,但是光谱数据信息量大,直接影响建模速度和预测精度,为此深入研究光谱数据处理方法和建模方法,提高光谱数据建模的速度和精度是当前近红外光谱定量分析研究的重点。本文综合运用光谱分析技术、化学计量学等方法,针对血红蛋白近红外光谱定量分析过程中的光谱预处理、建立模型、特征波长选择等数据处理方法做出进一步的研究和探讨,主要研究内容和结论如下:研究了偏最小二乘法(Partical Least Squares,PLS)模型和BP神经网络模型对于单一背景的血红蛋白含量的预测能力。最优PLS定量模型是经过Savitzky-Golay卷积平滑预处理后建立的SGPLS模型,该模型的校正集和预测集决定系数Rc、Rp分别为0.9999、0.9998,校正集和预测集均方根误差RMSEC、RMSEP分别为0.4845、1.0727;最优BP定量模型为隐层神经元数为8,学习速率为0.1时获得,该模型的Rc、Rp、RMSEC、RMSEP分别为0.9948、0.9843、1.086、7.9619。结果证明,两种模型都能够对单一背景的血红蛋白含量作出准确的预测。研究了PLS定量模型和BP定量模型对于复杂背景的血红蛋白含量的预测能力。PLS模型的Rc、Rp、RMSEC、RMSEP分别为0.4884、0.4749、10.0128、9.3652;BP模型的Rc、Rp、RMSEC、RMSEP分别为0.9999、0.9649、0.2213、3.0041。结果证明,针对复杂的血红蛋白的预测,BP神经网络的预测结果更好。研究了单一背景下的PLS模型和BP模型对于复杂背景的血红蛋白的预测能力并对模型进行了更新。当更新模型的样品数量达到一定比例(30%)时,更新后的BP模型的Rp达到0.9303,更新后的PLS模型的Rp达到0.6362。结果表明,更新后的模型对于复杂背景血红蛋白的预测结果更准确,其中更新后的BP定量模型的预测结果更好,能够满足复杂背景的血红蛋白定量分析的需求。研究了血红蛋白定量分析模型的特征波长选择方法。比较了等间隔偏最小二乘法(iPLS)和主成分分析(PCA)对血红蛋白光谱特征波长的选择能力。实验结果表明:对于PLS模型来讲,确定了通过iPLS优选出的波长建立的定量模型最优,该模型Rc、Rp、RMSEC、RMSEP分别为0.9994、0.9968、1.5223、3.4841;对于BP模型来讲,同样是通过iPLS筛选出的波长建立的iPLSBP模型最优,该模型的Rc、Rp、RMSEC、RMSEP分别为0.9996、0.9958、1.444、7.630。说明等间隔偏最小二乘法能够有效的筛选出特征光谱,简化模型,提高预测精度。综上,本文研究了偏最小二乘法和BP神经网络两种建模方法,比较了两种模型在血红蛋白定量分析中预测性能的差异,针对背景复杂、个体差异性大的复杂样品体系,BP神经网络的预测结果更好,为解决血红蛋白在体测量面临的人体环境干扰和个体差异性的问题提供了一种方法。