光谱数据解析中的变量筛选方法

来源 :光谱学与光谱分析 | 被引量 : 0次 | 上传用户:ZGGILOVE
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何从海量或高维数据中“提纯”出有用的信息,这是当前数据分析面临的一个巨大的挑战,也是当前研究的一个热点.变量筛选技术能够从众多、复杂的量测数据中提取出特征信息变量,达到简化多元模型乃至提高模型预测性能等目的.在光谱分析中,来自噪声等诸多因素的影响,量测数据会不可避免地包含干扰和无关信息变量,以及变量间存在的多重共线性,这些都会影响模型的稳健性和预测能力.近年来变量(波长)筛选方法在光谱解析领域的研究与应用中取得了较大的进展.结合国内外相关研究文献和作者的研究体会,不仅仅综述了近红外光谱,还综述了中红外光谱、拉曼光谱等众多筛选变量的方法的提出、特点、发展、类别、比较和近五年来在不同领域的应用进展.其中,评价变量重要性的参数及其标准或阈值的选择、搜索变量的策略和途径是变量筛选方法的关键.而且每种方法都具有各自的优势和局限性,实际使用中要根据方法自身特点结合目标体系的特征选择合适的方法.重点内容:(1)对比了光谱数据分析中常用的波长筛选和波段筛选方法;(2)对比了基于PLS模型参数的不同变量筛选方法的原理和特点;(3)根据搜索和筛选变量策略的不同将变量筛选方法进行分类评述.最后,围绕在解析实际复杂体系中变量筛选方法出现的过拟合、不稳定等问题进行了讨论并提出相应的解决措施,同时对变量筛选方法的研究趋势、发展前景和应用方向进行了展望.其中,新的评价变量重要性的判据和搜索变量的策略等工作仍需要展开深入地研究.期望本综述能够对光谱变量筛选的后续研究及应用起到积极的推动作用.
其他文献
基于生态经济学中的外部性原理,结合湿地生态系统的准公共物品属性、外部经济性、外部不经济性以及代际外部性等属性,分析湿地退化的成因.结果表明:湿地萎缩加剧、生态服务功能衰退主要是由于人类缺乏对湿地功能与效益的正确认识,以及不合理的利益分配机制导致的成本外溢现象,从事湿地保护的正外部性行为未得到应有的补偿,负外部性行为未付出应有的代价,并提出应建立因地制宜的多元化生态补偿机制.
应用紫外分光光度法分析芳烃及芳烃衍生物,以苯、萘、菲3种物质作为代表性物质,选用正己烷为溶剂,在5个特征波长下测试物质的吸光强度.检出限为12.9×10-9~20.5×10-9,空白加标准确度为98.9%~101.4%,精密度为3.73%~4.51%,实际样品的加标回收分析基本满足要求.在分析测试方法上做了优化,对环境污染小,对人体毒害低,安全性高,既缩减了成本又提高了效率.该方法的准确度精密度高,简便易行,可满足地质行业分析测试的要求,适用于油气化探样品中芳烃类的大批量集中分析测试.
通过采集重庆市典型农业区南川区8496件表层土壤样品,测定土壤锗及其他元素的含量,对锗含量特征及其影响因素进行分析探讨.研究结果表明:南川区土壤锗含量变化范围为0.13×10~(-6)~13.59×10~(-6),平均值为1.54×10~(-6),高于重庆市"一小时经济圈"和重庆紫色土壤中锗的平均含量.研究区富锗(1.4×10~(-6)以上)土壤面积达1 559.8 km~2,主要分布在研究区南部
试验于2018年夏玉米生长季在临沂设施农业气象试验站自动控制遮雨棚内水分控制场进行,以郑单958(ZD958)为试材,在水分临界期(拔节-开花期)设计5个水分梯度控制试验,模拟研究干旱胁迫对夏玉米光合生理与产量形成的影响.结果表明:水分临界期持续干旱胁迫下,开花期夏玉米叶片叶绿素a含量、净光合速率、气孔导度、蒸腾速率、株高、叶面积、地上部干物重均降低,且干旱胁迫越重降低幅度越大,T5处理下上述要素分别较T1处理下降42.6%、75.5%、83.2%、65.1%、27.5%、18.2%和44.9%.随着干旱
通过对辽宁北部地区岩石、土壤和植物中硒元素的地球化学研究,分析了硒元素在岩石-土壤-植物中的释放-迁移-吸收特征与数量变化规律.研究结果表明:岩石样品硒含量平均值为0.08×10-6,总体上岩石中硒质量分数呈现火山岩>碳酸盐岩>花岗岩/沉积岩>变质岩的规律;垂向上硒质量分数呈现土壤A层>土壤B层>成土母岩的变化规律;土壤表层硒平均含量0.24×10-6,土壤中硒质量分数总体上呈现棕壤(A、B层)>水稻土(A、B层)>草甸土(A、B层)>风砂土(A、B层)的规律;植物中硒平均含量0.07×10-6,植物对土
青海省柴达木盆地是著名的钾肥生产基地,也是中国盐类矿产的主要产地.以往盐类矿产勘查主要针对第四纪浅部盐类矿产,对第四纪深部及古近纪—新近纪卤水钾矿工作程度较低,资源勘查情况不明.由于盐湖区浅部卤水矿化度较高,会对电阻率类方法造成严重的低阻屏蔽效应,从而影响其探测深度,对于应用地球物理方法造成了极大的局限性.为查明该区深部卤水钾矿资源情况,采用对低阻异常敏感、信号强度大、纵横向分辨率高的瞬变电磁法(TEM),并结合勘探深度较大的大地电磁测深法(MT)对深层卤水钾矿进行探测.勘查结果识别出了相对低阻异常区,经
利用1951—2016年海南岛18个气象观测站逐日降水资料以及NCEP逐6 h再分析资料,统计分析海南岛冬季暴雨的时空特征,并以2008年12月27—28日和2013年12月14—15日两次冬季持续性暴雨过程为例,分析海南岛冬季暴雨的主要影响系统及其环流异常特征.结果表明:(1)近66 a来,海南岛冬季暴雨多发生在初冬(12月),且具有明显的年际及年代际变化特征,2000年以后冬季暴雨出现频繁;(2)海南岛冬季暴雨日数和雨量均自西向东逐渐递增,其中心均位于东南部的万宁地区;(3)典型冬季暴雨过程中,海南岛
火山矿泥是一种于严苛条件下历经数百年形成的珍稀矿产资源,目前尚无判定及评价其质量的方法.本研究采用因子分析法及最小数据集理论构建火山矿泥质量评价方法,并对五大连池风景区内火山矿泥质量进行综合评价.研究结果表明:火山矿泥质量评价最小数据集包括V、Al、含水量、黏粒,将五大连池火山矿泥分为4个质量等级,其中I级火山矿泥的储量最大,约占总储量的一半.新期火山周边火山矿泥质量最好,西部火山周边的火山矿泥质量整体优于东部.
利用1961—2019年安徽滁州地区7个国家站常规气象观测资料和1980—2019年小麦生育期观测资料及单产数据,采用多时间尺度的SPEI旱涝指数,探讨分析滁州地区气象旱涝特征及其对小麦产量的影响.结果表明:滁州地区SPEI具有明显的月际、季节变化特征,冬季各月的SPEI收敛性最强,夏季各月的SPEI离散度最大,且呈现明显的春旱、夏涝特征,季节性连旱、连涝中春夏连旱、春夏连涝造成的影响最重.滁州市2000年以后春季呈现干旱化态势,20世纪90年代后夏、冬季均转为变湿的态势,尤以冬季变湿趋势最为显著,而秋季
通过对太行山区木作沟泥石流实地勘查,分析并总结了该沟泥石流形成条件及发育特征.在此基础上,采用经验公式法计算了木作沟泥石流运动特征参数值,即4条主要支沟典型断面处泥石流流速、峰值流量、整体冲击力等参数,进一步分析了泥石流活动及发展趋势,最后计算得到泥石流最大危险范围.研究结果表明:木作沟具有利于泥石流形成的地形条件、气象水文条件及物源条件;泥石流易发程度为易发,发展阶段为壮年期,并逐步向衰退期过渡.综合判断木作沟具备再次发生泥石流的条件,对沟内居民仍具有严重威胁.建议在泥石流形成区设置谷坊坝,在流通区修建