稀硫化PLS回归方法在光谱学中的应用与实现

来源 :扬州大学 | 被引量 : 0次 | 上传用户:zhwa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光谱测量是一种常用的物质检测技术,特点是分析速率高、无损耗、绿色低成本且容易实时在线分析。根据其自身的优势,光谱测量技术已经被广泛应用于医药、农业、化工业等科学领域。然而,通过光谱测量得到的数据一般具有“高维度、低样本”的特征,并且谱带间存在严重的重叠问题,使得光谱数据较为复杂,难以直观地做出分析与判断。基于这一问题,本文使用近红外光谱测量技术,面向多组分分析,重点研究化学计量学中的多元回归方法,利用不同的算法进行建模分析并比较实验结果。偏最小二乘是近红外光谱分析中应用最为广泛的一种算法,它能够有效克服高维光谱数据中的多重相关性问题,提取有效信息,降低模型中的变量维度。但究其本质,偏最小二乘算法中的隐变量是原自变量的线性组合,它将所有的原始变量都带入模型进行预测分析,从而可能存在无关或者冗余的变量信息,使得模型相对于原始变量并没有实现变量选择,变量信息无法解释,因此需要引入稀疏化方法,从真正意义上达到变量选择的效果。本文的研究工作着手于模型稀疏化,从协方差估计、重加权和阈值约束三个方面达到对光谱数据的波长选择,除此以外还对样本进行选择,利用波长选择的思想处理样本选择问题。主要工作如下:1.本文提出基于稀疏矩阵变换(SMT)的协方差估计方法,通过具有高度相关性的变量之间的坐标转换达到剔除部分无效或冗余变量的效果,使得变量之间相互独立,提高协方差估计的稳定性和准确性。将SMT估计加入偏最小二乘算法中,并继续对偏最小二乘建模过程中进行重加权处理,得到稀疏化的偏最小二乘(SPLS)方法,最后将PLS和SMT-PLS以及SMT-SPLS这三种回归方法进行分析对比。2.提出基于框架的稀疏化学习方法,其本质思想是对多元回归方法计算得到的回归系数值再次进行函数处理,设定阈值从而剔除部分无效变量,该框架算法的优势在于迭代多次进行稀疏化变量选择。同时,将框架与稀疏化的偏最小二乘方法相集成(IRLS-SPLS),达到不仅能在框架中使用不同的函数对自变量进行加权惩罚,还能循环多次处理回归系数。最后通过软件程序实现并将结果与其他多元回归方法相比较。3.借鉴变量选择的思想用于样本选择,利用非线性的偏最小二乘方法对样本进行自动选择,再加入权重值对结果再次稀疏,或者结合稀疏化迭代框架的设计对样本进行迭代选择。在本设计点中针对于大样本量的数据,如果样本量过少则不适用于稀疏化方法,否则会使得模型欠拟合。
其他文献
2005年,农业部兽药监管工作力度将进一步加大。其重点是,以查处非法制售兽用生物制品为突破口,依法打击制售假劣兽药活动,取缔兽药非法生产、经营黑窝点;查处非法制售疫苗活动,维护
十九大报告提出“建立全面规范透明、标准科学、约束有力的预算制度,全面实施绩效管理”。《关于全面实施预算绩效管理的意见》于2018年由新华社授权发布,明确了全面预算绩效
进度管理是项目管理中根据资源优化配置原则,实现项目总工期符合计划目标的重要手段,其重点是如何合理分解项目工作任务及配置其资源投入。项目进度管理在多个领域被广泛应用
<正>~~
期刊
中心城市交通管理体制正朝着“一城一交”的方向发展,但也存在着部门交叉、规划衔接补偿、交通运输服务管理亟待完善、投融资机制有待创新和综合执法缺乏综合体系等问题。中
目的:了解蚌埠医学院第一附属医院住院患者全血标本中分离出的MRKP临床分布特征及其对常用抗菌药物的耐药情况;分析肺炎克雷伯菌携带的β-内酰胺酶及β-内酰胺酶耐药基因型;
我国是世界上禽蛋产量最大的国家,连续十几年来,平均年增长率居全球之冠,然而出口量却一直下滑.以供应香港为例,过去几乎全部是国内企业供给,而现在仅占50%左右的份额.美国鲜
汽车在直线行驶中发生跑偏不仅会造成零部件及轮胎等的磨损,而且会增加驾驶员的疲劳程度,随着人们对汽车整体性能要求的提高,汽车行驶跑偏问题日益受到行业关注,为避免具有严
目前,高职院校英语教学中存在着许多问题,直接影响着人才培养质量,难以满足不断增长的社会需求。高职高专英语教学改革应立足实际,面向未来,将英语课堂教学和英语应用能力发展与学
地下岩土的热物性参数是地源热泵地埋管换热器设计的关键参数,文中介绍了基于地埋管换热器线源理论的岩土物性分析方法,并对测试装置的实现做了简单介绍,开发了土壤热物性模