论文部分内容阅读
日常生活中,我们尝到的“味道”实际上是一种多感官现象,它是由味觉和嗅觉共同感受的。味道分子和气味分子不仅可以调节和改善食品的味道,还与人体健康息息相关。在味道与气味识别方面,实验方法虽然可得到较为准确的结果,但过程费时费力,且不能大批量地识别;经典的机器学习方法在味道气味预测中应用广泛,但预测结果准确性相对较差;深度学习方法凭借其构建高性能模型预测的能力,已用于味道与气味的预测。目前,深度学习在分子味道气味预测方面存在的问题有:(1)多使用人工筛选特征导致误差较大;(2)难以解释分子定量结构-味道/气味关系。为此,本研究开展了以下工作:1)本文采用多层感知机(Multilayer Perceptron,MLP)和分子指纹、多层感知机和分子描述符,以及卷积神经网络(Convolutional Neural Network,CNN)和分子二维图像方法针对分子苦味/非苦味、甜味/非甜味,以及苦味/甜味预测构建了9种模型,研究了定量结构-味道关系(Quantitative Structure-Taste Relationship,QSTR)。结果表明这9种模型在分子味道预测中各有优势。其中基于MLP和分子指纹构建的模型具有最强的预测能力(AUC值分别为:0.94、0.94和0.95);基于CNN和分子图像构建的模型仅以简单的分子二维图像作为输入,实现自动化提取特征以避免人工筛选特征所导致的误差,具有较好的预测能力(AUC值分别为:0.88、0.90和0.91);基于MLP和分子描述符构建的模型同样具有较好的预测能力(AUC值分别为:0.94、0.84和0.87)。基于MLP和分子描述符的QSTR模型研究了分子定量结构-味道关系,得到了利于分子苦味识别的特征,包括:分子的疏水特征、分子组成信息和分子形状;利于分子甜味识别的特征,包括:分子表面相互作用、分子量和电荷性。2)本文基于MLP和分子描述符、MLP和分子指纹,以及CNN和分子二维图像,针对有气味/无气味、果香味/无气味、花香味/无气味和木质味/无气味构建了12种二分类预测模型,针对无气味/果香味/花香味/木质味构建了3种多分类预测模型,并研究了定量结构-气味关系(Quantitative Structure-Odor Relationship,QSOR)。结果表明这15种模型都有较好的预测能力:基于MLP和分子描述符构建的模型预测结果最佳(二分类预测模型的AUC值均为0.99;多分类模型的AUC值为0.86);CNN模型通过简单的输入能够与气味标签构建联系,实现了自动提取分子的结构特征,具有较好的预测能力(二分类模型的AUC值均大于0.98;多分类模型的AUC值为0.80);基于MLP和分子指纹构建的模型同样得到了较好的预测效果(二分类预测模型的AUC值均大于0.93;多分类模型的AUC值为0.80)。通过基于MLP和分子描述符构建的模型研究了分子定量结构-气味关系,结果表明:分子量、电负性和表面相互作用利于识别有气味分子的特征;部分电荷与电子信息、分子表面相互作用和分子形状利于识别果香味分子的特征;分子的疏水特征、分子组成信息和电子信息利于识别花香味分子的特征;分子表面相互作用、电子信息和分子形状利于木质味分子识别的特征。综上所述,基于MLP和分子指纹构建的模型与基于MLP和分子描述符构建的模型分别具有最强的分子味道预测能力和分子气味预测能力。本文采用CNN模型预测分子苦味甜味,CNN模型凭借分子二维图像便能实现分子味道和气味预测,避免了人工特征筛选所产生的误差,得到了较好的结果。此外,基于MLP和分子描述符构建的模型可获得利于识别分子苦味、甜味和多种气味的特征。本研究所构建的模型有助于分子味道/气味的预测,所研究的分子定量结构-味道/气味关系有助于了解化学结构与味道/气味感知关系的机制,为深度学习的可解释性研究提供了理论依据。