机器学习在分子/原子光谱数据分析中的应用

来源 :桂林电子科技大学 | 被引量 : 1次 | 上传用户:LAP281482184
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光谱技术具有快速、无污染、无需复杂样品制备等特点,然而在光谱分析时存在着一些问题,如光谱易受基体效应、温度漂移、光源能量抖动等实验环境影响,从而稳定性差,而将机器学习应用于光谱分析过程中,可以提取更多信息、抑制干扰信号的影响以及剔除异常数据。本文引入主成分分析法、偏最小二乘法(Partial Least-Square,PLS)、随机森林(Random Forests,RF)、深层神经网络(Deep Neural Networks,DNN)、卷积神经网络(Convolutional Neural Networks,CNN)五种机器学习算法,并将上述算法应用在原子光谱——激光诱导击穿光谱(Laser Induced Breakdown Spectroscopy,LIBS)和分子光谱——显微红外光谱检测中对光谱特征提取、噪声消减、模型构建等方面的实际效果,并进一步评价了机器学习算法在光谱定量定性分析过程中的效果。文章首先以分析化学需氧量(Chemical Oxygen Demand,COD)为例,将机器学习应用于建立基于LIBS的水质快速预测模型。COD是重要的水质污染指标,是多种元素共同作用的结果,因此使用了PLS这一多变量回归算法。当采用PLS对两条河流的光谱数据建模时,模型效果较差,其原因是两条河流水体中的元素呈现显著差异,导致线性的PLS模型传递性较差。针对这一问题,本文采用了RF这一非线性算法。RF经参数优化后,得到了预测更为准确的模型,表明了机器学习在原子光谱中的成功应用。进一步地,在讨论机器学习在分子光谱中的应用时,以大米产地溯源和种类区分为例,结合显微红外光谱和机器学习算法,建立不同产地和不同品种大米区分模型。实验采集了14种大米的显微红外光谱,首先使用常规机器学习算法RF对这些样本进行产地和种类区分,然而模型预测准确率仅为57.1%。为了准确地区分大米的产地及品种,进一步地引入了DNN和CNN两种深度学习算法,并分别建立了大米的产地及种类区分模型,其预测准确率均达到90%以上。研究结果表明在基于显微红外光谱的大米的产地溯源和种类区分过程中,深度机器学习算法较之常规机器学习算法更为有效,这也证明了深度机器学习算法在分子光谱中应用的可行性。上述问题中均涉及大量的数据处理,通过将机器学习算法应用在原子光谱和分子光谱分析过程,这些问题均得到了妥善解决,这表明在原子光谱和分子光谱分析的过程中,机器学习是一种很有效的工具,也表明了机器学习算法在定量和定性分析方面均有优势,进而可以将机器学习算法推广到其他对象的光谱数据分析建模应用。
其他文献
光学表面等离子体共振技术作为光子学的一个重要研究方向,在生物传感应用领域受到了极大关注。以光纤为传输基底的表面等离子体共振生物传感器,其机理是通过光束在纤芯-包层界面产生全反射衰减,激发光纤表面金属内部自由电子,使之产生有规律的振荡运动,即表面等离子体波;表面等离子体波沿金属界面具有波长范围的传输距离,当光纤表面附着生物介质时,周围环境改变将会影响表面等离子体波的传输信息。光纤表面等离子体共振生物
为进一步了解兴城地区常州沟组-串岭沟组沉积环境及物源区构造背景,在常州沟组、串岭沟组岩石学特征研究的基础上,结合野外地质调查和粒度分析以及地球化学数据分析,确定了常州沟组-串岭沟组的沉积环境,归纳了兴城地区常州沟组-串岭沟组沉积物源特征,进而研究分析其构造背景。常州沟组地层与下伏的太古代绥中花岗岩呈不整合接触。岩石学研究表明,常州沟组下部主要为粗粒及中细粒长石石英砂岩和长石砂岩,可见粒序层理、板状
在重力作用下,沿垂直细丝纤维向下流动的覆膜流动是一种不稳定的开式薄膜流动。流体薄膜流动过程涉及多种现象,呈现出复杂的动力学过程和行为,这些现象及其发展方式之间的平衡将极大地影响覆膜工艺的质量。对于流体薄膜流动特性的研究极具工程应用价值和科研价值。本文以普通流体和自浸润流体作为研究对象,研究了流体薄膜流动的流动特性。在长波近似理论的框架下,建立了流体薄膜界面的演化方程,研究了热毛细效应对绝对对流不稳
木质素是一种储量丰富且有着巨大应用潜力的农林生物质资源,对其实现高值化利用具有重要的经济意义。本论文以玉米秸秆酶解木质素为原料,通过对其进行功能化改性制备出不同结
船舶、港机、航空、桥梁等大型构件由于其尺寸巨大,通常需要多个工件进行拼装、焊接,大型构件的焊接过程主要是通过人工焊接的法进行加工,既会对人的身体造成多种危害,又会面临效率低下,生产质量以及工期无法保证等问题,因此迫切需要采用机器人等成套的自动化焊接设备来取代人工。在焊接生产时,焊接接头的质量是评判产品是否合格的重要因素之一,而焊接的工艺参数的选择又决定了接头质量的好坏。为了提升大型构件的焊接质量,
近些年随着我国机动车数量的增长,道路交通变得越来越拥挤,交通事故数量也呈增长趋势。研究显示交通事故受害者中行人占了很大比例,因此开发一款可以规避行人的辅助驾驶系统的需求变得越来越迫切。人物检测作为其中的核心技术被越来越多的人所关注。本文针对人物检测中使用单一特征的不足,设计了一种基于特征融合和数据降维的方法,目的是提高检测准确率和优化检测速度。本文首先对图像进行了预处理,为后续工作做准备。归一化了
异相Fenton反应具有氧化能力强、矿化效率高、催化剂便于分离和回收等优点,成为水体保护和治理的研究热点之一。但是该方法面临催化剂pH适用范围窄、Fe3+向Fe2+转换速率慢、活性较低、污泥造成二次污染等问题。近年来报道了二维碳材料可用作Fenton反应催化剂,该类型材料具有结构稳定、导电性能好、比表面积大等特性,显示较好的催化性能。其中,g-C3N4不含金属元素,避免了Fenton反应过程中金属
本文主要是为了开发设计出一款具有实时采集、缓存管理现场生产数据,支持不同设备间数据互联互通等功能的嵌入式工业通信网关服务器,同时基于OPC规范,实现工业通信网关的采集数据接口技术和对外服务接口技术,实现OPC服务器和客户端应用高度集成,以此大大提高工业控制系统的通信效率和通信可靠性。本文梳理了工业控制系统发展历程,阐明了课题研究意义;详细论述了OPC技术、嵌入式技术等前沿技术的发展现状、特征以及在
互联网信息技术的快速发展和各种服务平台的相继推出,导致我们处于信息爆炸增长的时代。人们要想从海量的数据中找出自己感兴趣的信息也变得愈加困难。因此,推荐系统在这样的背景下产生,推荐系统通过分析用户的历史行为,找出用户的个性化需求,从而给用户推荐他可能会感兴趣的内容来帮助用户得到更好的用户体验。如今,推荐系统已经在电影和视频推荐、音乐电台、社交网络、个性化阅读等各大领域得到很好的应用。目前,出现了很多
中国是松香的生产和出口大国,每年松香的产量超过40万吨。设计合成具有生物活性的松香基衍生物,是松香高效利用的有效途径之一。本文以脱氢枞酸为原料,设计合成了松香基α-氨