小样本情况下的太赫兹光谱识别研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:zxc00663340
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物质的太赫兹光谱具有独特的“指纹谱”特性,因此可以利用该特性对物质进行识别。随着人工智能技术的发展,机器学习以及深度学习算法在太赫兹光谱识别领域也得到了越来越广泛的运用。尤其深度学习技术与大规模标注训练数据集的集成使得大规模目标识别达到了较高的性能水平。然而,在实际应用中,受实验设备、实验条件以及实验环境等因素的影响,我们所获取的太赫兹光谱数据并不总是大规模的,甚至在某段采样频率内物质的太赫兹光谱数据出现了缺失的情况,无法满足深度学习算法所需的大量数据。如何有效的利用这些小样本数据对物质进行识别是太赫兹光谱识别领域当前面临的一个较大问题。为了解决这一问题,本文探讨了一种基于特征迁移的太赫兹光谱识别方法。首先利用S-G滤波和三次样条插值法对Maltotriose,Maloheptaose,Maltotetraose,Maltopentaose,Malthexaose在0.9-6Thz内的太赫兹透射光谱数据进行预处理,并以Maltotriose,Maloheptaose在0.9-6Thz的太赫兹透射光谱作为源域数据集,以Maltotetraose,Maltopentaose,Malthexaose在0.9-6thz的太赫兹透射光谱作为目标域数据集,然后训练一个卷积神经网络(Convolutional neural network,CNN)用于提取源数据集的光谱特征并将提取的源域数据集的特征迁移到目标域数据集上,最后将融合得到的光谱特征输入至集成分类器进行分类识别。实验结果表明,基于特征迁移的太赫兹光谱识别方法能有效地解决样本数量不足导致的过拟合问题,提高小样本情况下的太赫兹光谱识别准确率。基于特征迁移的太赫兹光谱识别方法也存在着一定的局限性,当源域数据集与目标域数据集相关性较低时,迁移效果将大打折扣,甚至出现负迁移的现象。因此本文还研究了小样本太赫兹光谱数据增强及识别方法。该方法不仅能修复缺损的太赫兹光谱数据,同时可以生成数据以增强光谱数据多样性,从而更好地对物质进行识别。首先用同样的数据处理方法对十种物质(Anthraquinone、Benomyl、Carbazole、Mannose、Riboflavin、Malthexaose、Maltoheptaose、Maltopentaose、Maltotetraose、Maltotriose)的光谱数据进行预处理,然后通过生成对抗网络(generative adversarial networks,GAN)对存在缺失的太赫兹光谱数据进行修复,此外GAN还可以生成具有真实太赫兹光谱数据分布的仿真数据。最后,将修复后的数据、生成的数据以及真实光谱数据作为训练样本对深层神经网络(deep neural network,DNN)进行训练,从而得出物质的识别结果。实验结果表明,GAN可以有效修复缺失的太赫兹光谱数据,且所生成的太赫兹光谱数据有效地模拟了真实太赫兹光谱数据的总体特征,增加了太赫兹光谱数据样本,极大地提高了光谱识别精度。
其他文献
学位
乳腺癌是全世界女性发病率最高的肿瘤类型,已经成为严重威胁全球女性健康的主要公共卫生问题之一。肿瘤干细胞是一小部分具有自我更新能力、成瘤性、多向分化潜力的肿瘤细胞,被认为是癌症的起点,并在癌症的复发和转移中起到了关键作用。靶向肿瘤干细胞的治疗为乳腺癌患者提供了新的方向。研究显示E3泛素连接酶BCA2(breast cancer associated gene 2)与肿瘤的发生发展、膜受体的运输、以及
目的:构建1.3倍乙肝病毒(HBV)B2、B3、C1、C2、I1亚型全基因真核表达载体瞬时转染细胞模型,观察HBV抗原表达情况及转染不同HBV基因亚型后对细胞周期的影响;利用Cas9/g RNA双表达载体系统,筛选出针对不同HBV亚型的最适靶标序列或序列组合。方法:将1.3倍乙肝病毒(HBV)B2、B3、C2亚型全基因真核表达载体瞬时转染不同背景的五株肝(癌)细胞系,收集24、48、72、96、1
药物滥用被认为是一种成瘾性的脑疾病。了解药物滥用和毒品成瘾的脑机制,特别是其所涉及的神经回路及其分子机制是解决成瘾问题的一大关键。以往的研究主要集中在直接使用药物的人员身上,对间接暴露于药物作用下的子代的研究不多。孕期毒品暴露不仅影响胚胎的生长发育,也会影响子代的生理和心理发育。但由于社会环境的复杂性,结论并不统一。因此有必要利用相对简单的动物模型进行研究。我们之前的研究发现胚胎期吗啡暴露对成年大
基因组不稳定是癌症发展的一个“有利特征”,与正常组织细胞相比,癌前病变和肿瘤细胞的DNA损伤及复制应激程度普遍较高。p53作为重要抑癌基因,不仅能调控细胞周期阻滞、诱导细胞凋亡,还能调节DNA损伤修复等信号通路维持基因组稳定,抑制肿瘤发生。然而,据统计约有1/2的人类恶性肿瘤中都存在着p53的缺失或突变。并且p53突变主要发生在p53蛋白的DNA结合区域,使p53蛋白失去了序列特异的转录活性,导致
恶性肿瘤是危害人们生命健康的重大疾病,尽管肿瘤的治疗有了一定的进展,但是抗肿瘤药物的研发还是任重而道远。在超过50%的肿瘤患者中存在p53基因的突变,p53基因突变后获得功能而变成癌基因可促进肿瘤的发生和发展。目前证实了突变p53可作为抗肿瘤药物的靶点,其中采用小分子化合物使mutp53恢复野生型功能是一研究的热点。紫铆因(Butein)属于黄多酚类物质,具有消炎、抑菌、抗病毒、抗肿瘤、保护心血管
我国农田土壤重金属超标严重,目前已知污染土壤的修复方式虽有很多,但大多是室内盆栽实验,野外大田实地修复的研究较少。本研究首先对云南省个旧市大屯镇试验农田土壤重金属污染状况和土壤基本理化性质进行调查,根据内梅罗综合污染指数将实验地划分为3个不同污染程度的区域,对重度污染区采用钝化修复、中度污染区采用玉米间种超富集植物修复、低污染区采用低积累蔬菜种植3种修复方式。对高污染区的钝化修复采取1%硫酸亚铁(
近年来城市化的发展加剧了空气质量的恶化;道路车辆的数量急剧增加,使交通运输业成为影响空气质量的重要污染源之一。其中,柴油内燃机因其使用率较高,且对环境和人体健康的严重危害性,日益引起了研究人员的关注。柴油燃料的不完全燃烧导致众多尾气污染物的排放,并引发多种危害,柴油内燃机尾气污染物是引发空气污染的重要源头之一。尾气中的颗粒物是雾霾天气形成的重要原因,并对呼吸系统有害;碳氧化物会影响全球气候及全球碳
在造成土壤污染的众多重金属中,镉(Cd)是较为常见的一种元素。外源施加植物激素,可有效缓解重金属对植物产生的危害。单一植物生长调节剂在促进超富集植物生长和提高土壤修复效率方面已取得很多成果,但有关两种植物生长调节剂配合施用于某种超富集植物的研究甚少,并且鲜有关于激素喷施时间、方式对超富集植物富集重金属影响的报道。因此,为研究植物激素吲哚乙酸(IAA)和激动素(KT)配合施用对Cd超富集植物龙葵(S
随着印染纺织工业的迅速发展,染料废水成为当今社会工业废水污染的重要来源。重金属通常被用作媒染剂以加强染料固色效果,因此,产生了大量含重金属的染料废水。由于重金属物质和染料分子具有成分复杂、毒性大(致畸、致癌、致致突)、难以处理等特点,对人体健康和环境生态系统都具有极大威胁。因此,探究绿色高效的处理方法对重金属和染料废水的治理具有重要意义。本研究以碳纳米管(CNTs)为载体,基于其具有高比表面积、良