光谱数据解析中的变量筛选方法

来源 :光谱学与光谱分析 | 被引量 : 0次 | 上传用户:ZGGILOVE
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何从海量或高维数据中“提纯”出有用的信息,这是当前数据分析面临的一个巨大的挑战,也是当前研究的一个热点.变量筛选技术能够从众多、复杂的量测数据中提取出特征信息变量,达到简化多元模型乃至提高模型预测性能等目的.在光谱分析中,来自噪声等诸多因素的影响,量测数据会不可避免地包含干扰和无关信息变量,以及变量间存在的多重共线性,这些都会影响模型的稳健性和预测能力.近年来变量(波长)筛选方法在光谱解析领域的研究与应用中取得了较大的进展.结合国内外相关研究文献和作者的研究体会,不仅仅综述了近红外光谱,还综述了中红外光谱、拉曼光谱等众多筛选变量的方法的提出、特点、发展、类别、比较和近五年来在不同领域的应用进展.其中,评价变量重要性的参数及其标准或阈值的选择、搜索变量的策略和途径是变量筛选方法的关键.而且每种方法都具有各自的优势和局限性,实际使用中要根据方法自身特点结合目标体系的特征选择合适的方法.重点内容:(1)对比了光谱数据分析中常用的波长筛选和波段筛选方法;(2)对比了基于PLS模型参数的不同变量筛选方法的原理和特点;(3)根据搜索和筛选变量策略的不同将变量筛选方法进行分类评述.最后,围绕在解析实际复杂体系中变量筛选方法出现的过拟合、不稳定等问题进行了讨论并提出相应的解决措施,同时对变量筛选方法的研究趋势、发展前景和应用方向进行了展望.其中,新的评价变量重要性的判据和搜索变量的策略等工作仍需要展开深入地研究.期望本综述能够对光谱变量筛选的后续研究及应用起到积极的推动作用.
其他文献
基于生态经济学中的外部性原理,结合湿地生态系统的准公共物品属性、外部经济性、外部不经济性以及代际外部性等属性,分析湿地退化的成因.结果表明:湿地萎缩加剧、生态服务功能衰退主要是由于人类缺乏对湿地功能与效益的正确认识,以及不合理的利益分配机制导致的成本外溢现象,从事湿地保护的正外部性行为未得到应有的补偿,负外部性行为未付出应有的代价,并提出应建立因地制宜的多元化生态补偿机制.
通过对辽宁北部地区岩石、土壤和植物中硒元素的地球化学研究,分析了硒元素在岩石-土壤-植物中的释放-迁移-吸收特征与数量变化规律.研究结果表明:岩石样品硒含量平均值为0.08×10-6,总体上岩石中硒质量分数呈现火山岩>碳酸盐岩>花岗岩/沉积岩>变质岩的规律;垂向上硒质量分数呈现土壤A层>土壤B层>成土母岩的变化规律;土壤表层硒平均含量0.24×10-6,土壤中硒质量分数总体上呈现棕壤(A、B层)>水稻土(A、B层)>草甸土(A、B层)>风砂土(A、B层)的规律;植物中硒平均含量0.07×10-6,植物对土