论文部分内容阅读
目的:细胞周期素依赖性激酶(CDKS)是丝氨酸/苏氨酸蛋白激酶家族的成员,能够通过调节G/S以及G2/M期而影响整个细胞周期进程。CDK2作为CDKS的催化亚基,对主要负责有丝分裂以及DNA复制的G1-S期的调控作用较强,多种癌症中均发现CDK2的异常表达而导致细胞周期紊乱的情况。现阶段已经研究出很多抗肿瘤CDK2抑制剂,但是仅有少数的几个进入了临床试验。本实验拟建立一种合理的虚拟筛选方案,筛选出具有新型母核结构,抗肿瘤活性强的CDK2抑制剂。方法:通过建立基于配体以及基于结构相结合的多层虚拟筛选方法来筛选出具有对CDK2蛋白有抑制活性的苗头化合物,再通过分子动力学以及MM/PBSA自由能计算选择其中对蛋白结合最稳定,亲和力最强的先导化合物。多层虚拟筛选方法主要建立并优化三个模型:支持向量机(SVM),蛋白配体指纹图谱(PLIF)药效团以及分子对接。分子动力学主要包括RMSD结合稳定性分析,最后通过计算范德华能,静电能,极性溶剂化以及非极性溶剂化能来计算MM/PBSA结合自由能。结果:1、使用LibSVM建立的SVM模型再进行参数和描述符优化:在C=32,γ=0.125使用遗传算法优选的最佳描述符时,训练集和测试集的预测的总体准确率最好,分别为99.79%以及92.72%。2、PLIF方法显示了氨基酸残基Glu81以及Leu83与大部分配体生成相互作用,并据此生成了5个药效团,其中药效团3对训练集的产率以及命中率为89.6%以及12.5%,对测试集总体准确率为94.32%,因此被选中用于建立多层虚拟筛选法。3、NDCG的计算结果表明:GOLD对接中的Chemscore打分函数能够真实的反应CDK2与配体结合的真实情况,将Chemscore打分阈值设置成-7的时候,在该打分函数下能够对测试集拥有较低的假阳性率和较高的总体准确率。4、将建立的虚拟筛选模型对验证集375个抑制剂,155528个阴性化合物)进行测试,命中率为80.1%,富集因子为332.83,产率为73.8%,最终耗时为1.62 h,说明此多层虚拟筛选模型能够准确有效的在化学数据库中筛选CDK2抑制剂。5、使用此模型从BindingDB,Pubchem以及NCI数据库中筛选得到了6个苗头化合物,在进行分子动力学以及MM/PBSA自由能计算后,最终确定了2个与CDK2亲和力强,结合稳定并具有新型母核结构的化合物。结论:1、多层虚拟筛选方法由于将基于配体以及基于结构的虚拟筛选方法结合到一起,而同时考虑并利用到了受体和配体的信息,使其在筛选的效率和准确度上相比任何一个方法单独使用有了很大的提高。2、最终筛选得到的两个先导化合物MM/PBSA结合能计算结果和分子动力学结果与CDK2抑制剂Milciclib相似,说明这两个化合物与Milciclib有着相似的结合模式,稳定性以及亲和能力。3、本实验结果表明建立的多层虚拟筛选法能够用来筛选CDK2抑制剂,筛选得到的化合物具有新型母核以及对CDK2蛋白具有高度的结合稳定性以及亲和力,进一步开发该母核作为CDK2抑制剂具有很大的意义。