论文部分内容阅读
计算机技术的出现为生物科学的深入研究提供了重要的分析手段。指纹图谱技术的发展为全面和精准研究生物样本的重要组分信息如蛋白质和脂质提供技术支持,也为寻找生物标记物提供了技术保障。因此将两者结合,一方面可保证数据采集的完整性,另一方面可通过相应模式识别算法快速准确寻找指纹图谱差异和内在规律,为生物检测提供研究新思路。针对乳品工业中频繁出现的牛乳掺假问题,已有一系列牛乳质量检测的靶标性方法。但是,现有的检测方法大多集中在针对某一种掺假物质检测,倘若是未知的掺假物,则需要对牛乳中的物质逐一检测,当面对乳品工业化中大量需检测的乳制品时,此种方法不仅耗时耗力,而且在检测还原乳时,此种方法显的力不从心。因此,基于以上问题,我们采用指纹图谱技术结合模式识别算法研究牛乳经济掺假。本研究以牛乳掺假植物性外源蛋白和还原乳为研究对象,从牛乳完整蛋白和多肽指纹图谱出发,利用流动注射指纹技术、凝胶电泳技术、傅里叶变换衰减全反射红外光谱(ATR-FTIR),超高效液相色谱时间飞行质谱(UPLC-Q-TOF-MS)、三维内源荧光技术及二维外源荧光技术采集样品的指纹图谱,结合多种模式识别方法判断牛乳是否掺假,旨在为牛乳的质量监控提供新型的检测方法和研究思路。主要研究内容和结果如下:(1)提出了一种基于完整蛋白的流动注射指纹和凝胶电泳图谱技术结合模式识别算法检测牛乳掺假的方法。对于流动注射指纹图谱,利用分子量测定算法(MoWeD)对样品完整蛋白信号进行电荷去卷积化处理,在其图谱中检测到两种相对分子量分别为18,277.5和18,362.5 Da的蛋白,暂时鉴定为β-lactoglobulin B和β-lactoglobulin A;并结合偏最小二乘分类(PLS-DA)和支持向量机(SVM)算法对生鲜乳和掺假样品分类,其正确率均高达100%,牛乳中检测外源性蛋白的检测限为0.5%(w/v)且每个样品检测时间需2 min;而对于牛乳中掺假物的判断,则采用多分类算法,结果表明SVM的分类识别结果优于PLS-DA和反向传播人工神经网络(BP-ANN),并使用SVR预测牛乳中掺假物的含量,掺假大豆蛋白和乳清蛋白测试集的决定系数较高(R2test set>0.8000),预测误差较小。而对于凝胶电泳指纹图谱,结合PCA分析则能清晰的区分不同掺假样品和纯牛乳,其检测限为5%。(2)构建了傅里叶变换衰减全反射红外光谱(ATR-FTIR)结合化学计量学检测生鲜乳和还原乳的方法。为达到无偏估计的目的,因此在集群分析(MPA)条件下,比较五种模式识别算法即支持向量机(SVM)、朴素贝叶斯(NB)、随机森林(RF)、簇类独立软模式法(SIMCA)及偏最小二乘法判别分析(PLS-DA)判定真实和掺假牛乳的性能,并以10种指标为衡量标准,发现SVM的分类性能最佳,其分类正确率高达95%,特异性为98%,Matthews相关系数高达91%,其相应的标准差均为5%。其次,红外光谱经Savitzky-Golay平滑、标准矢量归一化(SNV)、多元散射校正(MSC)、一阶导数及二阶导数预处理,结果表明红外光谱经SNV预处理后,PLS-DA的预测正确率达到100%,偏最小二乘回归(PLSR)模型决定系数达到0.8846,测试集误差较小,回归性能最佳。(3)从蛋白组学的角度出发,提出了一种基于多肽和完整蛋白指纹图谱检测牛乳掺假的方法,将牛乳的完整蛋白和多肽指纹图谱分别与PLS-DA和SVM两种分类算法结合分析,发现其分类正确率分别高达100%;并将样品的完整蛋白和多肽指纹图谱信息通过低维和中维数据融合算法分析,将PLS-DA和PLSR得到特征值通过中维数据融合,能够在低维空间从可视化的角度清晰区分还原乳和生鲜乳,检测限低至0.5%。(4)提出了一种基于三维内源荧光和二维外源荧光结合计量学检测还原乳的方法。采集样品内源荧光图谱后使用MATLAB绘制其相应的三维荧光图和等高线图,通过可视化的角度发现掺假5%奶粉的还原乳与生鲜乳有明显的差异;此外,结合平行因子分析,从投影得分图观察到生鲜乳和还原乳有明显的分布差异,但因其有部分重叠,通过分类模型SVM和PLS-DA进一步判别,发现SVM的分类正确率高达95.83%;其次,对于二维外源荧光图谱,通过向样品中加入荧光染料8-苯胺-1-萘磺酸(1,8-ANS)后采集其图谱,将二维荧光图谱结合PCA能够较为清晰区分掺假和真实的牛乳,而且发现其相应的主成分1和主成分2的载荷最大发射波长均为450500 nm,最后采用分类模型SVM和PLS-DA对二维外源荧光进行分析,结果表明其对掺假和真实牛乳的分类正确率高达100%,检测限低至0.5%。综上所述,此研究建立了牛乳掺假检测的光谱和质谱指纹图谱技术结合模式识别分析方法,为其检测提供了坚实理论数据支持,为构建牛乳质量控制的大数据平台提供研究思路。