基于机器学习的拉曼光谱智能分析

来源 :厦门大学 | 被引量 : 0次 | 上传用户:HELING0702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
拉曼光谱可以提供丰富的样品分子结构信息,是科研以及工业中应用广泛的光谱技术。近年来拉曼光谱数据分析技术的快速发展,使得拉曼光谱得到了更加充分的利用。然而当前基于拉曼光谱的物质识别问题的前沿研究大多是针对二分类或者三分类等类别数较少的任务,在多分类问题上还存在挑战。另外,对于引入了深度学习技术的拉曼光谱多分类研究,目前的研究仅涉及到大规模的拉曼标准数据库。但往往在实际工作中,研究工作者能获得的拉曼数据是有限的,难以获取分类模型所需要的大量数据。因此,深入研究基于拉曼光谱的多分类任务并解决实际应用中光谱数据不足的问题是急迫且重要的。本论文的研究工作分为两部分,一是利用机器学习算法研究基于RRUFF矿石拉曼数据库的多分类问题,探索该问题上的最佳解决方案;二是结合迁移学习和深度学习技术研究小规模拉曼数据的复杂分类任务,解决实验难以获得庞大拉曼数据量以训练模型的难题,从而真正实现将机器学习技术应用在实际研究工作中。具体研究内容以及结论如下:1.将机器学习模型用在RRUFF矿石拉曼数据库的分类任务上,构建六种机器学习模型(支持向量机、随机森林、K-近邻、全连接深度神经网络、卷积神经网络和循环神经网络)用以比较各模型在该任务上的表现,然后对效果最优的模型做进一步地优化。结果显示我们构建的循环神经网络(RNN)在拉曼光谱的多分类问题上的表现显著超越了文献报道的在此问题上效果最优的卷积神经网络(CNN),将任务的分类准确率提升了 5.8%,并且我们发现1-范数正则化(L1)相比2-范数正则化(L2)更加契合光谱数据特性,引入L1和数据增强(Data Augmentation)可以将模型的分类准确率进一步提升2.3%。2.将迁移学习模型用于实验拉曼数据的复杂分类任务上,搭建两种不同的迁移学习模型:基于全连接神经网络(DNN)的迁移学习和基于CNN的迁移学习用以验证迁移学习能对模型产生的提升效果。实验结果显示我们构建的迁移学习模型在该任务上的效果显著,相比于非迁移模型,分类准确率有4.1%的提升。并且我们发现,不仅是利用与目标数据集相似的标准数据库的预训练能对模型带来效果的提升,利用与我们实验拉曼光谱数据相似度不高的矿石拉曼数据库进行预训练也能提升模型的分类准确率,这种模型对源数据集多样化的接受度使得迁移学习的可应用场景可以进一步拓宽。
其他文献
目前,国内普遍采用单片机或DSP作为控制系统的微处理器来实现仿人机器人的控制.用单片机或DSP控制机器人时占用接口资源较多,所需外围元器件也较多,对整个系统的稳定性和可靠
人工智能为中医药图书馆的发展提供了新环境。文章主要从中医药图书馆的现状、面临的机遇和挑战、中医药图书馆遇上人工智能以及中医药图书馆的未来等四个方面,阐述了人工智
目的:探讨阿尔茨海默病合并骨折患者围术期护理效果。方法:将2016年1月~2018年1月90例阿尔茨海默病合并骨折患者随机分为对照组和观察组各45例,对照组行常规护理,观察组加强围
<正>赣府厅字[2017]4号2017年1月14日各市、县(区)人民政府,省政府各部门:《江西省贯彻加快中西部教育发展指导意见的实施方案》已经省政府同意,现印发给你们,请认真贯彻执行
期刊
随着我国绝对贫困人口大量减少,一般居民因病致贫的问题则日益凸显。这表明贫困问题由长期性的生存贫困转变为突发性的风险贫困;并且因病致贫风险威胁的对象也不再局限于低收
<正>赣府发[2017]29号2017年7月18日各市、县(区)人民政府,省政府各部门:为贯彻落实《国务院关于加快发展康复辅助器具产业的若干意见》(国发[2016]60号),加快推进我省康复辅
期刊
提出一种基于Lonworks总线的环境监测系统的设计方案.阐述了Neuron Chip3150与PIC单片机的通信连线以及3150与电力线的通信方式.给出了系统的硬件及软件设计方案.本系统具有稳定、可靠、可扩展等特点,可推广应用于相关领域.
<正>赣府发[2017]32号2017年8月23日各市、县(区)人民政府,省政府各部门:为认真贯彻落实国务院深化简政放权放管结合优化服务改革电视电话会议精神和《国务院办公厅关于印发
期刊
讨论了一阶微分方程有形如μ=μ(xm+yn)的积分因子的充要条件,并给出了新的一类典型微分方程的积分因子求法,具有一定的理论价值和实用价值.
21世纪的世界步入了高科技飞速发展的阶段,高科技领域正以瞬息万变的速度发展,革新与创新层出不穷,发明与发现目不暇接,恰如一只千变万化的万花筒。推动这一变化的动力是那些
期刊