基于深度学习的化合物逆合成系统设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:daxiang11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
逆合成分析系统在药物设计和材料应用等诸多领域有着重要作用,从20世纪中期开始越来越多的研究者投入到该领域的研究中。近年来深度学习的迅猛发展给许多领域都带来了里程碑式的提升,其中处理欧几里德数据的图神经网络自2009年首次提出后,至今有了长足的发展。而化学分子是典型的图结构数据,以往的逆合成分析系统或是基于规则的专家系统或是基于传统神经网络模型,本文尝试以图神经网络为基础并结合最近新发布的化学分子开源处理工具来对化学分子进行处理。同时受轰动一时的AlphaGo启发,利用蒙特卡洛树搜索技术在庞大的分解树空间中找到一条满足需要的逆分解路径,并达到一种计算资源开销与搜索效果的平衡。本文最终实现了整体系统并对两部分方法进行了测试,全文主要研究内容如下。设计并实现单步逆分解方法,这是整个逆合成系统的基础部分。该方法以图神经网络为核心,输入一个目标分子,最终得到该目标分子适用的反应模板列表。此方法仍以化学规则为基础,但是规则不再是由人工编码而是由开源工具根据进行过原子序号匹配的反应自动提取。以规则为基础的模型执行逆分解得到的分子能够比较好地避免出现不符合化学规律的“错误”分子的情况。同时使用图神经网络可以避免进行耗时的子图匹配操作,使得查找目标分子适用的反应模板操作能在1秒钟左右的时间内完成,这种方式较大程度地提升了查找效率。设计并实现了路径构建方法,该方法以蒙特卡洛树搜索为基础,实现了其中主要的四个阶段,并自定义了激励回传函数以指导系统偏向于搜索落在原料库中的路径。最后对上述两个方法进行了系统的测试,并针对实验结果作出了分析同时说明了相关缺陷可能的原因。在单步逆分解方法的测试中,达到了80%的查准率和65%的召回率,表明方法基本达到了可用的效果。而在路径构建方法中,所得逆合成路径最终步骤分子的平均原料命中率达到61.8%。从整体测试结果来看,系统基本实现了预期的设计目标并达到了初步可用的效果。系统的整体结构具备一定的灵活性,对于一些更为具体的需求可以针对相关部分进行一定的扩展和修改。
其他文献
以植物藜(Chenopodium album Lin.)为研究对象,以萝卜蚜(Lipaphis erysimi Kaltenbach)为目标害虫,以萝卜蚜的触杀率和拒食死亡率为目标指数,研究植物藜对蚜虫的杀虫活性,拓展新
本研究从数值模拟着手,以大庆油田地质参数为参考,设定了储层韵律、井网类型、变异系数、油水粘度比、井距五个方面相互交叉组合的各类概念模型,在完成对井网井距的优化之后,
低渗透碳酸盐岩储层孔隙结构复杂,孔隙类型多样,裂缝与溶蚀孔洞广泛发育、非均质性较强。结合X-CT扫描图像,将碳酸盐岩岩心划分为孔隙型、裂缝型、溶孔型三种不同的岩心类型
目前我国风电的发展已经进入到一个变革阶段,产业格局出现不同的发展态势。越来越多的风电场对于机组的后期运维逐渐重视。特别是对于运行时间久的风电场,其运维方式也在向着精益化转变。如何提高机组的可利用率,降低故障率,保证不发生重大安全事故,这是许多风电从业人员正在考虑,通过各种方法正在解决的问题。维护方式定制化转变,故障处理的快速响应,故障处理方法的多样性是目前解决这一问题最好的选择。本文针对某风电场机
钛合金具有良好的综合性能,被广泛应用在各行各业中,但钛合金硬度较低使得其在某些方面的应用受到限制,提高钛合金材料硬度显得尤为重要,表面处理技术是提高材料性能的直接途径,电火花沉积技术是近年来发展的表面处理技术,涂层不仅不会产生热变形还可以提升涂层综合性能使得涂层与基体间呈现冶金结合而被研究者广泛关注。本文围绕钛合金电火花沉积NiCr-3涂层试验展开相关研究,分析电火花沉积工艺参数对涂层表面质量、界
水凝胶是一类以水为分散介质的高分子网络体系,由于其高亲水性和生物相容性而在许多领域中得到应用,例如药物输送、组织工程、传感器和执行器等。传统的水凝胶在使用时容易损
叶绿体基因组较小、拷贝数高、结构保守,包含了植物光合作用和质体半自主性遗传的重要基因。叶绿体基因和基因组为分子进化研究提供了重要信息,且常用于植物分子系统学研究。
GaN作为第三代宽禁带半导体材料的代表,由于其禁带宽度大、临界击穿电场高、导热率高等优势,使其在功率半导体领域表现出巨大的潜力。一方面,GaN-on-Si的发展使得GaN器件的成本显著下降,这对于GaN材料的应用和发展是具有里程碑意义的。另一方面,由于GaN HEMT器件属于平面器件,与现有的Si基半导体制造工艺兼容性较强,这使其更容易与其他半导体器件集成。正因如此,对于GaN器件的研究也越来越受
自动驾驶技术是应用于车载AI中控系统的核心技术,是实现"智慧汽车"、"智慧交通"和"智慧城市"的关键,随着自动驾驶技术的日益成熟和传统汽车行业的越发饱和,基于人工智能的自动驾驶汽车将是颠覆传统汽车市场且具有深远意义的产品。传统的自动驾驶目标检测已不能满足现阶段自动驾驶的需求,因此本文针对自动驾驶背景下深度学习目标检测及方向控制展开研究,通过深度学习卷积神经网络模型识别目标车辆和行人,判断运动趋势、
噻虫嗪是新一代的烟碱类杀虫剂,具有低毒、活性高、安全性强、杀虫谱广、作用速率快、持效期长、对环境污染小等优势,在农业杀虫剂市场占有重要的份额。但是,现有对于噻虫嗪