稳健回归技术及其在光谱分析中的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:luoshibo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代工业生产过程中,为了严格控制产品质量,降低能耗与生产成本,减少对环境的污染,需要加强对产品质量的监测分析。产品质量分析方法主要包括化学分析法与仪器分析法,目前仪器分析法已成为分析方法的主流。光谱分析技术,因其分析速度快、对样品无损、操作技术要求低等优势,已成为一类常用的仪器分析方法,近年来得到了普遍的重视与广泛的应用。光谱定量分析大都采用如下方法:首先基于一组已知组成或属性的训练样本与对应的谱图建立光谱分析模型,再基于该模型与未知样品的谱图对未知样品的组成或性质进行分析计算。然而,实际应用中,受环境干扰、仪表偏差和人为失误等因素的影响,训练样本数据集中很可能存在部分异常样本;这些异常样本显著地降低了分析模型的可靠性与准确性。如何避免或减少异常或错误训练样本对分析结果的不利影响,已成为当前迫切需要解决的问题。本文以光谱定量分析为背景,对稳健回归技术进行了深入的研究,具体包括:1.针对现有稳健偏最小二乘(Partial Least Squares, PLS)的不足,提出了一种具有异常样本自动剔除功能的稳健PLS算法。该算法在建模过程中进行迭代计算,通过PLS回归误差分布确定置信区间,并由此自动剔除异常样本。同时,在现有局部回归的基础上,提出了稳健局部主成分回归(Principle Component Regression, PCR)算法。该算法对PCR所涉及的主成分分析和多元线性回归两个步骤都进行了稳健化处理,并在多元线性回归时采用了局部回归。上述稳健算法已应用于汽油辛烷值近红外光谱分析中,结果表明:这两种算法在稳健性和准确性上都优于其他线性稳健回归方法。2.为了提高现有最小二乘支持向量机(Least Squares Support Vector Machine, LS-SVM)的稳健性,提出了一种稳健的LS-SVM算法。该算法使用LS-SVM回归误差分布的稳健置信区间选择训练样本中尽可能多的正常样本用于LS-SVM建模,同时尽可能多地剔除异常样本。为了减少迭代计算时间,又提出了相应的快速算法。仿真与试验结果验证了算法的有效性。在此基础上,将该算法应用于汽油品质拉曼光谱分析仪中,运行结果表明,该方法能够有效检测出异常样本,模型预测精度符合实际应用的要求。3.针对原始加权LS-SVM (Weight LS-SVM, WLS-SVM)在收敛性和稳健性方面的不足,提出了一种WLS-SVM的稳健化迭代算法。该算法修正了原始WLS-SVM求取回归误差的计算公式,从根本上解决了WLS-SVM的收敛性问题;同时,对原始算法求权值的步骤进行了改进,采用回归误差的中值作为计算加权值的比较基准,从而大幅度提高了WLS-SVM的稳健性。4.为进一步提高WLS-SVM的稳健性,提出了一种结合M估计器的LS-SVM算法(MLS-SVM)。该算法用M估计器的残差代替LS-SVM目标函数中的最小二乘残差,并利用迭代方式求解修正后的优化问题。针对红外光谱分析的实验结果显示了该算法比WLS-SVM及其它常用的支持向量机算法更稳健,且计算时间与LS-SVM相差无几,可用于需要实时计算的场合。5.在上述研究的基础上,提出了广义LS-SVM算法(generalized LS-SVM, GLS-SVM)。该算法利用一般意义下的递减的残差偶函数代替了LS-SVM中的残差平方和,并采用迭代算法对GLS-SVM进行求解。在迭代计算过程中,并不需要计算残差偶函数,而只需要构造一个关于残差的加权函数;本文同时给出了几种典型的加权函数。针对烟草属性近红外光谱分析的研究结果表明,经过选择合适的加权函数,GLS-SVM具有良好的稳健性和预测精度。最后,在总结全文的基础上,对稳健回归技术及其应用进行了展望。
其他文献
凡本刊注明“文章来源:xxx”的作品,均转载自其他网络媒体,转载目的在于传递更多信息。但由于网络的特殊性常导致无法及时确认稿件作者并与作者取得联系。请作者见文后直接与
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
随着互联网技术发展,图书馆传统采访模式出现文献资源建设与读者需求不匹配等矛盾,而用户画像技术以挖掘用户行为需求为特点,有利于及时发现并满足读者个性化需求。通过建立
阐述了雷电定位系统的原理、组成以及黑龙江省雷电定位系统的应用情况。试验证实雷电定位系统是保证电力系统安全运行的监测手段之一。
本文就公伯峡水电站导流洞上游所遇到的断层破碎带,从构造地质学、地质力学、岩石学等角度进行了研究,并通过隧道地质工作分析其各种出露的地质特征,对该断层破碎带进行了超前地
日语用言也称活用词,包括动词、形容词和形容重词,均依其词尾变化即活用在句子中挥不同的作用。用言词尾的变化是作为“膠着语(胶着语)”的日语语法的重要组成部分,即用言词尾是胶
介绍了远程图像监控及智能报警系统功能、特点以及在牡丹江电业局110 kV中心、北郊无人值班变电所的现场应用情况;指出该系统具有自诊断功能、系统故障自动隔离功能、抗雷击
分析介绍了PowerBuilder开发工具与ORACLE数据库的两种接口方法,即通用ODBC方法和专用接口法。并从实用角度出发,论述了两种接口的实现方法及其相关应用问题。
介绍了一种在线监测电力系统暂态过电压装置.该装置采用无源电气信号输入方式高速同步采集.实践证明,该装置运行稳定可靠,能够准确地分析电力系统过电压故障的原因.
探讨自来水行业噪声环境对工人的听力影响,预防控制噪声的职业危害,保护工人身体健康;选择某自来水厂维修作业工人(电工、钳工、管道工)86名,同时选择其他工种工人(运转工、工程师)26