论文部分内容阅读
牛黄为中医常用的中药材,具有很高的药用价值,由于天然牛黄资源紧缺,市场上经常出现用价格低廉的黄连、大黄、蒲黄等中药冒充天然牛黄粉的不法行径,如何快速准确地识别牛黄具有十分重要的意义。中药天麻为传统名贵中药之一,广泛分布于我国西南至东北等地,由于遗传、生态环境因素的影响,不同产地的天麻品质存在较大差异。快速准确识别不同产地的天麻能够规范中药市场,并为临床正确用药提供参考。目前,中药的常用鉴别方法,主要为经验鉴别,显微鉴别和理化鉴别。上述几种方法有效、精确且针对性强,但是也存在一些缺点,例如前两种方法依据鉴定者的主观判断,缺乏明确的鉴定标准,对鉴定者的个人能力依赖性较大。理化鉴定方法对样品进行分析鉴别,会对被测样品造成破坏,且逐一分离比较耗时同时成本较高。太赫兹波(Terahertz,THz)是指频率范围在0.1~10THz的电磁波,具有电子和光学的双重特性。许多生物大分子的振动与转动能级都位于THz频段,同时由于太赫兹辐射的能量低,不会由于光子能量过高而电离破坏物质的结构,因此THz技术被广泛应用于无损检测领域。但是,对于中药这种成分较为复杂的样品,其在太赫兹波段没有明显的特征吸收峰,借助化学计量学方法可以提取样品太赫兹光谱中的有用信息,并建立识别模型进行识别分析。本文以牛黄及其易混品以及不同产地的天麻为研究对象,应用太赫兹光谱技术结合化学计量学方法建立识别模型。本文的主要研究内容如下:(1)牛黄及其易混品的识别研究。采用太赫兹时域光谱技术结合化学计量学方法对牛黄及其易混品进行鉴别分析。获取了黄连、大黄、蒲黄、人工牛黄、掺杂牛黄和天然牛黄的太赫兹时域光谱图,采用主成分分析方法对样品的太赫兹时域光谱信号进行分析,分别构建随机森林(RF)模型和三种参数优化的支持向量机(SVM)模型,对六种物质的太赫兹吸收光谱进行分类鉴别,最后对于样品数据集不平衡导致随机森林模型识别准确率下降的问题,提出基于合成少数类过采样技术(SMOTE)的随机森林模型。结果表明,随机森林模型和SVM模型均可达到95%左右的分类准确率,但随机森林模型具有更快的运行速度,运行时间仅为最优PSO-SVM模型运行时间的2%。基于SMOTE的随机森林模型可有效地解决数据不平衡情况下识别率低的问题,识别率从84.17%提高到94.17%,计算速度基本不变。(2)天麻及其产地检测的识别研究。采用太赫兹时域光谱技术结合化学计量学方法对不同产地的天麻进行鉴别分析。获取辽宁抚顺天麻、湖北恩施天麻、陕西汉中天麻、安徽金寨天麻以及云南昭通天麻的太赫兹吸谱图,采用光谱预处理方法,如SG平滑、一阶导数、二阶导数、标准正态变量变换(SNV)、多元散射校正(MSC)及其相互组合对原始光谱数据进行去噪和消除谱图的基线漂移处理。分别建立广义回归神经网络以及S_Kohonen神经网络模型,对五种经过光谱预处理之后的天麻太赫兹吸收谱数据进行分类鉴别,对比识别效果。结果表明,采用正交信号校正的光谱预处理方法,两种鉴别模型广义回归神经网络以及S_Kohonen神经网络模型都达到了最高的识别准确率,分别为92%和94%。通过研究对比发现对于不同产地天麻的鉴别,SNV光谱预处理结合S_Kohonen神经网络模型可以达到最优的识别效果。