【摘 要】
:
在近红外光谱数据分析中,全光谱数据具有波长点多、冗余量大、共线性关系严重的特点,导致了部分波长点对建立校正模型没有积极作用,甚至还会降低模型的预测能力.波长选择被证明是有效避免上述问题的重要方法.针对近红外光谱的特性,提出了一种基于直接正交信号校正(DOSC)与蒙特卡罗方法(Monte Carlo,MC)结合的波长选择算法.与大多数根据波长的“重要性”进行选择的方法不同,MC-DOSC依据波长的“不重要”性进行选择.波长“不重要”性通过DOSC的权重w来度量.首先将w归一化作为波长被滤除的概率,以此建立波
【机 构】
:
重庆大学大数据与软件学院 ,重庆 401331
论文部分内容阅读
在近红外光谱数据分析中,全光谱数据具有波长点多、冗余量大、共线性关系严重的特点,导致了部分波长点对建立校正模型没有积极作用,甚至还会降低模型的预测能力.波长选择被证明是有效避免上述问题的重要方法.针对近红外光谱的特性,提出了一种基于直接正交信号校正(DOSC)与蒙特卡罗方法(Monte Carlo,MC)结合的波长选择算法.与大多数根据波长的“重要性”进行选择的方法不同,MC-DOSC依据波长的“不重要”性进行选择.波长“不重要”性通过DOSC的权重w来度量.首先将w归一化作为波长被滤除的概率,以此建立波长选择的概率模型,并使用蒙特卡罗随机抽样得到N个波长子集的集合.在每一次抽样过程中,用选择的波长点建立PLS模型,计算相应的交叉验证均方根误差(RMSECV).经过N次随机抽样后,以RMSECV最小时的PLS模型对应的波长子集作为备选子集.将备选子集包含的光谱数据作为新的光谱阵,重复上述过程直到RMSECV不再下降为止.迭代停止后,将RMSECV最小的备选子集作为最佳波长子集.采用玉米数据集和汽油数据集对该算法进行测试,同时与蒙特卡罗无信息变量消除法(MCUVE)、遗传算法(GA)、竞争性自适应权重取样法(CARS)三种算法进行比较.实验结果表明:该算法能大幅度减少波长点个数,并且相应的PLS模型的预测能力也提高了.玉米数据集的实验运行结果,波长点个数从全光谱的700个减少到15个,预测集相关系数从0.8282提高到0.9314,RMSEP从0.1098减少到0.0713.汽油数据集的实验运行结果,波长点个数从全光谱的301个减少到31个,预测集相关系数从0.9875提高到0.9939,RMSEP从0.2555减少到0.1788.该算法在2个数据集中的表现均优于对比的三种算法.
其他文献
表面增强拉曼散射(SERS)技术具有高效,灵敏,无损检测等特点,能实现对分析物分子的极低浓度检测,被广泛应用于痕量分析领域.在生产和生活中,有些毒性物质或非法添加剂被人体摄入或长期接触后,在体内不断累积,最终导致中毒或者组织器官发生病变;环境中过量的有害物质残留,由于其本身的毒性或者使菌株和害虫产生抗药性而造成的生态系统破坏,会严重影响人们的正常生活;有些生物分子伴随疾病产生,可作为疾病的标志物,能给予人体健康诊断信息;有些抗癌药物由于本身具有毒性,使用时需要严格控制用量.因此,利用SERS技术对各领域分
地表水资源安全关系到国民健康、生态环境稳定和经济可持续发展,具有重要战略意义.总有机碳(T OC)是一种衡量水体中有机物含量的综合指标,其在水环境监管和治理中具有重要价值.传统检测方法通过高温催化氧化测定水样中T OC含量具有耗时较长、操作复杂的局限性,紫外-可见光谱技术具有检测速度快、操作简单的优势,因而在水质在线检测中具有较好的应用前景.国内外对地表水中T OC浓度的在线检测目前大多采用与COD浓度间的相关关系进行间接推算得到,这类方法对水体成分的稳定性要求较高.相比于常规的间接推算方法,采用光谱定量
利用近红外光谱技术对脑组织进行检测实现脑血肿的定位一直以来都是无损光学诊断的研究热点.为了实现开放式全方位的精准探测,基于功能性近红外光谱技术提出一种新的方法—阵列扫描式灵敏度法,即建立全方位阵列探测器,通过单边阵列式扫描检测来获取不同探测位置的光通量,计算每个探测器的探测灵敏度,就能得到全方位的探测信息.首先,建立单层有限元模型,设置光学参数、光源、探测位置及边界条件,将仿真结果与蒙特卡洛的运行结果进行对比,验证有限元模型条件设置的准确性.其次,根据人脑组织结构建立脑部模型,在模型中插入血肿,选择波长为
以Al2(SO4)3·18H2O、尿素为原料,采用水热-热解法制备了球形α-Al2O3粉体.以自制α-Al2O3、Y2O3及CeO2为原料,固相法制备了白光LED用Y2.93 Al5O12:0.07Ce3+黄色荧光粉,通过X射线衍射(XRD)、扫描电镜(SEM)、X射线能谱(EDS)及荧光光谱(PL)等对产物的物相、形貌及光致发光性能进行了表征.结果表明:水热-热解法制备出了物相纯净、分散性良好的球形α-Al2 O3粉体,以该α-Al2 O3为原料,合成出可被460 nm蓝光有效激发,发射光谱为峰值在55
近红外光谱(NIRS)在定量和判别分析中已得到广泛应用,化学计量学在其中发挥了重要作用,但仍需要建立基于新原理的方法,简化数据处理和建模过程,使近红外光谱分析更加方便、更加快速.多元光学计算(M O C)技术通过设计合适的光学滤波器可以在光谱测量的同时,根据光谱的整体形状得到定性定量结果.作为一种新的测量和计算方式,近年来在光谱分析领域逐渐得到应用.基于多元光学计算的原理,基于主成分分析和Fisher判别准则设计了近红外光谱的判别滤波器,将近红外光谱投影到二维空间,并在二维空间中计算每一类样品的置信椭圆作
很多物质在太赫兹波段内的光谱参数具有指纹特征,这是太赫兹技术在安检等众多领域有所应用的基础.但是,目前常用的太赫兹时域光谱(THz-TDS)技术提取物质光学参数的Duvillaret算法,要求样品上下表面平行且充分光滑.然而在很多有潜力的实际应用场合中,尤其是对于固体样品,表面粗糙度不可避免,并且不能使用模具压片等实验室制样手段来保证其表面的平行光滑特性,由此需要一种不受样品表面粗糙度影响且更具有普适性的光学参数提取算法来增加太赫兹时域光谱技术在实际场合下的应用能力.分析了太赫兹波透射表面粗糙样品的光程,
高丹草中粗蛋白质以及碳水化合物的含量丰富,适合青贮处理.优质的高丹草种子是发展畜牧业十分重要的前提,发芽率是检验种子质量最常规的指标之一,播前种子发芽率检测与筛选十分必要.现阶段采用发芽试验法进行种子发芽率的检测,周期长、成本高.基于此,提出利用近红外光谱对高丹草种子进行发芽率的快速、无损检测.选择适量的高丹草种子样品,采集近红外漫反射光谱,进行一阶导和二阶导预处理以及对比分析R2c,R2p,RESEC和RMSEP.采用支持向量机(SVM)建模,使用MATLAB中调用的LIBSVM软件包来实现SVM训练和
在近红外光谱分析过程中,单台仪器在不同时间的波长变化及多台仪器间的波长一致与否会对化学计量学定标模型的校正及传递效果产生影响,上述问题可以统一为波长漂移对定标模型的影响.以分析小麦粉中粗蛋白含量为例,首先结合不同谱区光谱数据,利用偏最小二乘回归(PLSR)方法建立了两个定标模型.再由计算机生成不同类型、不同幅度的波长漂移信息,并叠加至验证集样品光谱中,使新光谱相对于定标集光谱产生波长漂移信息.通过考察原定标模型对新光谱的预测与校正情况,研究了波长漂移对PLSR定标模型的影响.结果表明:相对于定标集样品光谱
作为一种绿色安全的食品药品配料,甜菊糖具有广阔的应用前景,然而吸湿性是其面临的一大难题,同时也是大多数制剂原辅料普遍存在的问题,研究分析吸湿的过程状态并提出针对性解决办法具有重要的理论意义和应用价值.利用近红外光谱分析技术结合化学计量学方法对甜菊糖吸湿过程进行表征、解析,从而揭示吸湿过程中水的吸附方式和键合作用;通过吸湿过程光谱并采用外部参数正交(EPO)算法消除样品中水分的影响,建立甜菊糖中莱鲍迪苷A(R A)含量的快速分析方法.研究表明,甜菊糖吸湿过程初始,水分子迅速吸附在甜菊糖粉末表面形成单分子层;
稻谷在储藏和运输过程中,在适宜的温湿度环境下极易发生霉变,导致大量的粮食浪费和巨大的经济损失,进而影响粮食安全.为解决传统的稻谷霉变检测存在的繁琐且耗时较长等不足,提出了基于近红外光谱图像处理和神经网络的稻谷霉变程度检测方法.首先,通过农业多光谱相机(Sequoia)和固定光源等设备,构建了霉变稻谷近红外图像数据采集平台,获取了黑龙江地区牡响、早香、彩稻三个品种不同的霉变状态(健康稻谷、轻度霉变、中度霉变)的近红外光谱成像数据.对于近红外光谱图像的160×160像素有效区域,应用数字图像处理技术结合光谱图