论文部分内容阅读
随着计算机科学的快速发展与计算模拟技术的日渐成熟,计算模拟手段在生命科学研究中的应用日益广泛并取得了丰硕的成果。由于生物系统的天然复杂性,现有的实验手段在深入解析生命活动机制时,常常面临着巨大的挑战,尤其是对于超越了普朗克常量尺度下的微观现象的解析,存在着诸多困难。这时计算模拟手段的出现恰好弥补这一技术上的限制。酶分子的结构与功能特性的研究,作为生命科学研究的核心领域之一,是揭示生命活动的重要基础,这一领域的研究目前尤其迫切需要计算模拟技术的辅助支持。借助这一’计算显微镜’技术,研究者们得以从微观角度在计算机内重现生命活动的奥秘,故此,生命科学研究也进入一个全新的阶段——计算与实验紧密结合的新型生命科学研究。在生物催化工程研究中,需要合适的酶作为催化剂。作为研究的核心内容,酶的催化剂性能至关重要,影响其催化能力的种种因素中,酶与底物间的特异性识别是最为根本的因素。常规的实验手段难以分析这种源于酶的微观结构特性而产生功能特性,为了寻找适合的酶作为催化剂,就必须采用大量的实验来测试不同的底物,构建不同的体系。从理论层面分析酶与底物间的特异性识别,就需要考虑到氢键、范德华作用、静电相互作用、疏水相互作用等原子间产生的非键相互作用,是这些作用共同决定了酶对于催化底物的选择性等宏观特性,而综合分析以上因素,必然需要在原子尺度上开展大量的计算模拟工作。然而,目前对于这一关键性的科学问题,仍然缺乏能够实现快速、高效、完善的分析计算工具与手段。本文即着眼于从现有的计算模拟方法出发,尝试构建全新的计算工具与算法,来解决这一重要科学问题。本文的研究工作主要分为两个部分:第一部分从酶的催化选择性出发,构建了一套算法用于预测酶的底物,即从化合物的集合中快速筛选出可能的底物分子;第二部分则侧重于酶催化潜力的充分挖掘,构建软件用以实现全新底物分子的搜索。两部分研究均着眼于建立具有应用价值的计算方法和工具,服务于未来的酶学的研究。希望通过计算模拟为实验的设计提供有效的指导,进而推进酶学研究中计算模拟与实验的良好结合,带来更多的认知和可能。在本文第一部分中,研究首先从催化机理出发,采用了基于分子对接的过度采样技术,设计了一套基于NAC模型的通用计算流程,并开发了一套计算机辅助酶的底物虚拟筛选软件。在计算模型的验证中,选择了一株已经商业化的脂肪酶——南极假丝酵母脂肪酶B(Candida Antarctic lipase B),作为底物选择性催化预测——底物虚拟筛选的对象。由于CALB能催化酯键水解及其逆向反应,且具有的高度底物选择性,区域选择性和对映体选择性,相关催化机理,结构,特性等实验数据与资料极为丰富,在食品、医药、化工、能源等领域发挥重要作用。通过深入的研究其相关的催化特性、对其结构和功能间对应性的详细分析整理、基于现有研究数据、统计分析和分子模拟的技术手段,通过底物分子的结构与酶的结构间的相互作用模式分析,提出了一套简单有效的底物选择性预测函数(CALB-SP),配合自行编写的配套工具,实现了针对脂肪酶的高准确率底物预测。在针对94个化合物的虚拟筛选中,实现了每天103个化合物预测速度,且预测的真阳性准确率高达92.7%。此外,在另一株腈水解酶(Nit6803)的验证中也达到的91.7%的准确率。本文第二部分中,构建了一套能够充分挖掘酶的催化潜力的计算模拟软件——底物的虚拟设计(De Novo Design)。该方法基于已知的酶与底物的催化机理和结构信息,运用蒙塔卡洛算法、分子力场、组合化学等技术,进行分子片段的虚拟生长,搜寻酶的潜在催化底物分子。该方法采用了被广泛接受的分子力学建模方法,通过结合理论计算得出的关键催化信息,建立了一种快速,高通量的预测新型底物分子的方法。对应的软件主要采用Python语言编写,整合第三方开源代码,通过MPI方式实现了高效的大规模并行计算(>512 CPU)。在随后的验证研究中,共采用了三个来源与功能都完全不同的酶作为测试对象。其中针对醛酮还原酶(Gox0644)的醛类底物展开的计算中,成功的找到了 9个与实验结果完全相符的底物,而在腈水解酶(Nit6803)的腈类底物计算结果中,出现了 18个与文献报道底物结构完全相同的底物。随后针对CALB的新型底物的虚拟设计中,除了实现与已报道8个底物结构的完全吻合外,还发现并通过实验的验证了 12个结构全新的底物,充分证明了该软件的准确性与可靠性。