基于深度学习的分子味道/气味预测模型构建及定量构效关系研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lessy123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日常生活中,我们尝到的“味道”实际上是一种多感官现象,它是由味觉和嗅觉共同感受的。味道分子和气味分子不仅可以调节和改善食品的味道,还与人体健康息息相关。在味道与气味识别方面,实验方法虽然可得到较为准确的结果,但过程费时费力,且不能大批量地识别;经典的机器学习方法在味道气味预测中应用广泛,但预测结果准确性相对较差;深度学习方法凭借其构建高性能模型预测的能力,已用于味道与气味的预测。目前,深度学习在分子味道气味预测方面存在的问题有:(1)多使用人工筛选特征导致误差较大;(2)难以解释分子定量结构-味道/气味关系。为此,本研究开展了以下工作:1)本文采用多层感知机(Multilayer Perceptron,MLP)和分子指纹、多层感知机和分子描述符,以及卷积神经网络(Convolutional Neural Network,CNN)和分子二维图像方法针对分子苦味/非苦味、甜味/非甜味,以及苦味/甜味预测构建了9种模型,研究了定量结构-味道关系(Quantitative Structure-Taste Relationship,QSTR)。结果表明这9种模型在分子味道预测中各有优势。其中基于MLP和分子指纹构建的模型具有最强的预测能力(AUC值分别为:0.94、0.94和0.95);基于CNN和分子图像构建的模型仅以简单的分子二维图像作为输入,实现自动化提取特征以避免人工筛选特征所导致的误差,具有较好的预测能力(AUC值分别为:0.88、0.90和0.91);基于MLP和分子描述符构建的模型同样具有较好的预测能力(AUC值分别为:0.94、0.84和0.87)。基于MLP和分子描述符的QSTR模型研究了分子定量结构-味道关系,得到了利于分子苦味识别的特征,包括:分子的疏水特征、分子组成信息和分子形状;利于分子甜味识别的特征,包括:分子表面相互作用、分子量和电荷性。2)本文基于MLP和分子描述符、MLP和分子指纹,以及CNN和分子二维图像,针对有气味/无气味、果香味/无气味、花香味/无气味和木质味/无气味构建了12种二分类预测模型,针对无气味/果香味/花香味/木质味构建了3种多分类预测模型,并研究了定量结构-气味关系(Quantitative Structure-Odor Relationship,QSOR)。结果表明这15种模型都有较好的预测能力:基于MLP和分子描述符构建的模型预测结果最佳(二分类预测模型的AUC值均为0.99;多分类模型的AUC值为0.86);CNN模型通过简单的输入能够与气味标签构建联系,实现了自动提取分子的结构特征,具有较好的预测能力(二分类模型的AUC值均大于0.98;多分类模型的AUC值为0.80);基于MLP和分子指纹构建的模型同样得到了较好的预测效果(二分类预测模型的AUC值均大于0.93;多分类模型的AUC值为0.80)。通过基于MLP和分子描述符构建的模型研究了分子定量结构-气味关系,结果表明:分子量、电负性和表面相互作用利于识别有气味分子的特征;部分电荷与电子信息、分子表面相互作用和分子形状利于识别果香味分子的特征;分子的疏水特征、分子组成信息和电子信息利于识别花香味分子的特征;分子表面相互作用、电子信息和分子形状利于木质味分子识别的特征。综上所述,基于MLP和分子指纹构建的模型与基于MLP和分子描述符构建的模型分别具有最强的分子味道预测能力和分子气味预测能力。本文采用CNN模型预测分子苦味甜味,CNN模型凭借分子二维图像便能实现分子味道和气味预测,避免了人工特征筛选所产生的误差,得到了较好的结果。此外,基于MLP和分子描述符构建的模型可获得利于识别分子苦味、甜味和多种气味的特征。本研究所构建的模型有助于分子味道/气味的预测,所研究的分子定量结构-味道/气味关系有助于了解化学结构与味道/气味感知关系的机制,为深度学习的可解释性研究提供了理论依据。
其他文献
学位
学位
This paper presents a hybrid ensemble classifier combined synthetic minority oversampling technique(SMOTE), random search(RS) hyper-parameters optimization algorithm and gradient boosting tree(GBT) to
期刊
据美国《每日邮报》报道,希腊研究人员发现,与一日三餐相比,一日六餐更有助于减肥。希腊雅典大学医学院专家对47名患有2型糖尿病或糖尿病前期的研究对象进行了为期24周的跟踪观察。他们发现,频繁进餐并保持总体热量消耗不变,有助于控制血糖,还能有效地抑制饥饿感。由艾米莉亚博士牵头的研究团队表示:"我们进行的体重维持研究表明,将一日三餐改为一日六餐,将会改善血糖控制,减少患有2型糖尿病或糖尿病前期的肥
期刊
学位
很多人都认为,年轻就是用来作的,年轻的生活就是用来任性的,想怎么吃怎么吃,想怎么玩怎么玩,想怎么熬夜就怎么熬夜!电竞选手简自豪因为糖尿病退出的新闻一时刷屏,让很多人突然发现,原来糖尿病问题距离年轻人也这么近!糖化血红蛋白高达11的测试结果,让很多内行人都感觉愕然,这日均血糖水平也太高了吧。当然,在年轻人当中,这么高的血糖并不多见,但是身体糖代谢受损和糖尿病前期的情况,在年轻人当中比想象中更为常见。
期刊
我国铅、锌储量丰富,铅锌冶炼行业发展迅速并产生大量冶炼渣,占用了土地资源,且冶炼渣中重金属迁移会对环境造成危害。因此,铅锌冶炼渣的处理和资源化利用应引起重视。铅锌冶炼渣含有大量SiO2,CaO,Al2O3等活性成分,具有制备碱激发材料固化危险废物的潜力。铬渣是一种含有高毒性六价铬的工业副产物,需无害化处理后填埋或资源化利用。本文以铅锌冶炼渣为原料制备碱激发材料,并利用碱激发铅锌冶炼渣固化铬渣。基于
低碳烯烃,尤其是乙烯和丙烯,是重要的基础有机化工原料,近年来国内外对低碳烯烃的需求量一直保持稳定增长。目前低碳烯烃约80%由石脑油裂解工艺生产,然而,石油和煤等化石燃料为不可再生资源,开发非石油或煤等化石燃料路线的替代方案具有重要战略意义。另一方面,由于CO2等温室气体对气候的影响,继CO2捕集、封存之后,利用CO2制备化学品成为研究热点。其中,围绕CO2加氢制低碳烯烃过程开发的Fe基、双金属基和
统一战线是中国革命的重要法宝之一,也是必须坚持的历史宝贵经验之一。习近平总书记关于加强和改进统一战线工作的重要思想,是以习近平同志为核心的党中央将统一战线与新时代中国特色社会主义相结合形成和发展起来的,既有深刻的历史渊源,也有鲜明的时代特征,体现了新的理念和新的实践,为新时代统一战线工作提供了根本遵循。
目前,我国风电、光伏装机容量和发电量稳居世界第一。随着“碳达峰、碳中和”战略目标实施,新能源产业必将迎来更快发展。然而,由于新能源资源时空分布不均,可以预见,新能源基地建设将在“三北”地区,而能源消纳市场主要在东南地区,新能源“西电东送”特征更加显著,全国范围的电力市场正在逐步形成。为了确保新能源健康有序发展,我国在新能源富集地区开展了一系列促进新能源消纳的电力市场建设创新实践,2018年起在甘肃