论文部分内容阅读
借助高性能并行计算的强大算力,基于微观层面上设计药物的分子动力学模拟方法能够产生丰富的蛋白构像,而基于分子对接设计药物的虚拟筛选方式可以筛选出靶向性极强的药物小分子,这两种药物研究手段均能加速新药的研发速度。但长期以来,它们对计算环境要求较高,并且软件依赖众多、部署复杂、不可迁移和在共享计算资源上升级易发生冲突,不仅耗费药物科研工作者大量的时间,而且给计算集群的部署与维护带来沉重的负担。除此以外,分子数据库中的化合物数量众多,长期以来筛选时间较长的问题也急需解决。本文探索了使用以隔离、安全和迁移为性能特征的容器虚拟化方式解决上述问题。首先使用HPL、HPCG和OSU等标准基准程序研究了KVM、Docker和Singularity三种虚拟化方案在CPU处理、存储、磁盘读取和网络带宽方面与物理机的性能损耗差异,然后使用两种典型的高性能计算应用VASP和WRF评估容器在真实算例下的多节点并行计算、GPU计算和跨平台迁移方面的性能。接下来选择上述基准性能实验中性能最佳的容器构建可同时满足三种经典分子动力学模拟的NAMD(CPU与GPU异构计算型)、AMBER(GPU并行版)和GROMACS(多节点并行版)容器环境,并应用到极具医疗研究价值的Ⅱ型糖尿病受体GLP-1R、与癌症相关的BRD9蛋白和起麻醉作用的μ-opioid受体与相应配体的分子动力学模拟研究中;最后在容器环境下研究了编译与预编译版的AutoDock Vina虚拟筛选工具的性能差异,基于性能最优的Vina版本构建和部署了基于MPI多节点并行虚拟筛选药物的容器系统,并研究了它的并行处理性能和完成对靶向肿瘤细胞的MTH1激酶的药物虚拟筛选。本文实验结果显示,通过基准性能评估,Singularity容器在计算峰值、存储、网络与磁盘读取方面的综合性能优于KVM和Docker,能够取得物理机般的计算结果;在真实应用场景下Singularity容器性能完全满足HPC的并行计算环境如MPI、GPU和Infiniband要求,并能够获得与物理机相似的精准结果,迁移性能实验也展现出了Singularity较高的性能稳定性。另外,使用构建的NAMD、AMBER和GROMACS容器计算环境对GLP-1R、BRD9和μ-opioid受体与相应配体的分子动力学模拟结果与物理机非常相似,其性能损耗可忽略不计;同时实验发现在靶向MTH1激酶的药物并行虚拟筛选实验中,编译版的Vina性能最优,并行虚拟筛选容器系统随着节点数的增多可以大幅度减少药物筛选时间,最终筛选出的药物分子可准确对接在MTH1的活性位点上。本文制作的镜像均已上传到镜像资源库中,药物研究者可以自行下载使用。