基于图神经网络的人体口服生物利用度预测研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:precursor1231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体口服生物利用度是人体口服药物研发中最重要的药代动力学特性之一。准确预测候选药物的人体口服生物利用度能够减少口服新药研发中的资源消耗。目前,常使用基于特定计算方法或基于专家定义的分子描述符结合机器学习算法构建预测模型。这种方式不仅需要手工抽取分子描述符,增加了工作量,而且不会为口服药物研发带来新见解和新思想。近年来,图神经网络因其能够天然建模分子结构信息而被广泛应用在分子性质预测中,但先前提出的图神经网络模型并没有充分考虑原子和化学键之间的相互作用,这限制了模型表达分子的能力。除此之外,不同深度的图神经网络对分子结构的感受范围是不同的,将不同深度的分子隐藏表示通过样本自适应的方式融合,或将提高图神经网络的分子表达能力。因此,本论文从原子和化学键信息交互与模型结构定义两大方面提出改进方法,开发更为精准、高效的人体口服生物利用度预测模型,主要工作和贡献如下:(1)提出了一种基于有向图的化学键消息吸收网络(BMANet),使用化学键消息吸收机制增加了原子和化学键之间的交互,获得更好的分子表示;使用缩放自注意力,使模型聚焦于重要特征,放大重要特征的数值同时减少非重要特征数值,提高分子表达能力。通过与4种机器学习模型和8种图神经网络模型比较,证明了BMANet的性能优于其他方法,且拥有较强的可解释能力。通过在公开图神经网络分子性质预测数据集上测试,证明了BMANet同样适用于其他分子性质预测任务,且优于其他模型。(2)提出了一种基于样本自适应的动态深度图神经网络(DD-GNN),使得图神经网络能够根据分子结构信息自适应的融合不同深度的分子隐藏表示,同时过滤噪声信息,提高分子表示能力。在公开数据集上的测试结果,证明了结合DDGNN的四种图神经网络的性能都有不同程度的提高,证明了DD-GNN对于图神经网络的通用性。(3)将BMANet与DD-GNN结合(DD-BMANet),开发性能更为强大的人体口服生物利用度预测模型。结果表明DD-BMANet在定量预测人体口服生物利用度方面有着更低的误差。在大部分情况下,DD-BMANet定性预测人体口服生物利用度的性能也优于BMANet。本文探索了使用图神经网络预测人体口服生物利用度预测的可能性,提出了化学键消息吸收网络(BMANet)和基于样本自适应的动态深度图神经网络(DD-GNN)。大量的实验证明了所提出方法在人体口服生物利用度预测方面具有先进性、良好的可解释性,并且同样适用于其他分子性质预测任务,为新药研发提供一个更高效、更精准的预测模型。
其他文献
近年来,随着科技的迅速发展,大数据的概念风靡全球,同时,大数据也在方方面面改变着我们的生活和工作。大数据的分析和运用改进了工作流程提升了质效,在客户画像和风险控制领域也得到了广泛应用。随着我国经济持续快速增长,银行服务实体经济能力不足的问题开始显现,小微企业、“三农”没有得到充分的金融支持,融资难、融资贵现象一直存在。小微企业、“三农”等客户群体,由于规模小,经营不太规范,信息不对称等原因,往往不
学位
商用车行业汽车经销商作为汽车厂商K集团最重要的产品销量渠道和服务供应渠道,是汽车厂商得以生存和发展的命脉。提升经销商综合能力也是汽车厂商在未来激烈竞争中脱颖而出的重要环节,对于经销商的管理,不能仅停留在对经销商进行考核、要求方面,如何选择、扶持、提升经销商综合能力必将成为汽车厂商核心竞争力之一;同时,优质经销商所反馈的市场信息,也将是汽车厂商进行市场分析、行业研究的重要资源,对汽车厂商的发展起到积
学位
我国城市化的不断快速推进,市政工程项目始终是城市工程扩建中的重要组成。基于此,在信息科技高速发达的新时期,运用信息化的平台加强市政工程的管理,是今后开展市政工程管理的必然趋势,可以针对当前市政工程管理中存在的项目和内容庞杂等问题实现有效地管理优化与提升。文章对市政工程管理中应用信息化的价值与必要性进行了介绍,并对信息化在市政工程管理中的实施与构建加以探讨。
期刊
房地产行业对于我国国民经济的发展有着举足轻重的地位,事关人民生活质量的提高和经济秩序的稳定。过去三十年,国内房企经历了飞跃的发展,其通过高周转、高杠杆的模式获取丰厚利润,而由于行业极高的利润率使其受到金融机构的青睐,从而能够长期依靠单一的融资方式便可获得开发所需资金。与此同时,行业长期积累的问题日益突出,给国家经济发展、金融稳定和民生都带来了负面影响,所以近十年国家针对房企融资、拿地、销售、回款等
学位
随着5G时代的到来,网络舆情事件的发展呈现出实时性,迅速性和广泛性等特性,使用机器学习和深度学习的方法进行网络舆论事件传播分析已经成为发展的潮流,然而现有的方法仍然存在一些问题:(1)中文短文本数据特征难以表达,会导致特征丢失;(2)非结构化数据的应用结构化的处理方式,难以描述事件传播变化的详细过程,生成的事件传播脉络存在局限。(3)在传播网络中,单一使用特征编码和时间序列的方式对事件传播级联效应
学位
近年来,随着国内外众多数字化技术发展的突飞猛进,企业基于这些新技术制定其自身转型发展战略的需求也尤为突显。工业4.0、中国制造2025、工业互联网这些国家级发展战略的提出,也为企业基于数字化转型发展提供了良好的外部环境和巨大的机遇。然而企业对其数字化转型发展战略制定的急迫性和必要性,目标以及转型发展路径尚不清楚,特别是数字化转型发展的内容体系和保障措施。本文以V公司为例进行研究。首先,对大量战略管
学位
审美趣味的标准问题历来存在争议,从休谟到康德,再到布尔迪厄,大致形成了三种经典的趣味标准:第一,以休谟为代表,以普遍性和差异性为原则的“经验”趣味标准;第二,以康德为代表,以个人性和群体性为原则的“共通感”趣味标准;第三,以布尔迪厄为代表,以必然性与一致性为原则的“阶层性”趣味标准。从社会学的角度出发,布尔迪厄探讨了三种不同的审美趣味:即统治阶级、中产阶级和被统治阶级的趣味,这三种阶级阶层的趣味由
期刊
对于基因序列的分析是生物信息学研究中基础且重要的部分,随着生物序列数据迅速增长,基因序列相似性分析的速度成为批量数据分析的瓶颈。为了提高基因序列分析及分类的速度,本文引入变值体系作为理论基础,探索序列相似性分析方法。论文将变值体系理论与非对齐序列相似性分析方法结合,由变值测量方法统计选定序列的变值测度,得到序列测度特征,以序列测度特征为基础,对序列进行差异对比及分析。分析模型的结果展现方式主要有三
学位
2021年伊始,全球化工产业链出现供应短缺、基础原材料价格大幅上涨的局面。由于极端寒潮天气而停产的墨西哥湾石油炼化基地成为导火索,全球多个关键化工原料供应短缺导致大量化工厂关停。叠加新冠疫情持续传播导致物流、人工等成本持续增加,使得化工原材料价格大幅上涨,最终导致制造业成本大幅增加,行业上下游格局不断变化。供应不足、断货、价格暴涨成为行业的常态,企业面临巨大的挑战,迫切需要优化营销策略以适应市场变
学位
随着中国经济社会的持续高速发展,党和政府逐渐明确了积极发展普惠金融的政策,并将大力发展普惠金融列入政府的重点工作。近年来,我国普惠金融发展取得了明显进步,国内的金融机构也都积极响应国家号召,降杠杆、稳发展,脱虚向实、赋能实体,解决融资困难,改善生活质量、激发市场活力,众多小微企业都获得了普惠金融的服务,普惠金融所带来更广阔的市场,同时也变成了金融业争夺的焦点。在如此背景下,商业银行作为传统银行业的
学位