论文部分内容阅读
分析化学是研究分析方法的科学,是人们获得物质化学组成和结构信息的科学。从70年代末到现在,以计算机应用为主要标志的信息时代的来临,给科学技术的发展带来巨大活力,分析化学又进一步与计算机科学紧密结合。目前,各种现代化的分析仪器的出现和广泛应用,使得在短时间内获得物质体系大量信息成为可能,这为化学计量学的数据提取研究提供了机遇。红外光谱的解析是化合物定性分析的重要依据。Munk等人于1990年首次将线性神经网络应用于红外光谱的子结构解析,随后各种方法,如各种人工神经网络(ANN),偏最小二乘(PLS),小波变换(WT),支持向量机(SVM)等逐步引入到红外光谱的计算机解析中,使模式识别在红外光谱的应用中得到很好的发展。本文尝试将遗传算法-偏最小二乘法(GA-PLS)作为红外光谱特征点的挑选方法用于烯烃的特征筛选,并利用支持向量机和人工神经网络对筛选后的特征点进行分类性能的检验。设计了一个分等级系统对OMNIC数据库中899个烯烃化合物进行分类。首先将烯烃化合物分为环烯烃和链烯烃两类化合物,进而对每一类烯烃进行下一级分类,以期扩大子结构,识别共轭烯烃不同的共轭基团。每一级分类都先用全谱建模后再用提取后的特征点构建模型。结果显示,GA-PLS是一个很好的特征提取的工具,用GA-PLS提取后的特征点构建的模型分类结果优于全谱的分类模型,降低了模型的复杂性、提高了分类器的预测能力。在此基础上,进一步探讨了筛选出的光谱片段区与结构之间的关系。在GA-PLS提取后的特征点中,选出对应于烯烃四个片段光谱区(C-H伸缩振动、C=C伸缩振动、C-H面内弯曲振动和C-H面外弯曲振动)的特征点来进行片段光谱的比较。实验结果表明,烯烃的C-H面外弯曲振动是分类烯烃是环烯烃或链烯烃的最重要的片段光谱。在分类环烯烃时,C=C伸缩振动有着重要的贡献。对于链烯烃的分类,烯烃的C-H伸缩振动是与双键共轭的链烯烃区别去其他共轭链烯烃的最有效的光谱片段,而C=C伸缩振动是鉴别链烯烃化合物是否共轭以及与羰基共轭的链烯烃、与芳环共轭的链烯烃、与羰基和芳环都共轭的链烯烃的重要光谱片段。