论文部分内容阅读
甾体是一类生物界中广泛存在的,参与调节生物体各种生命活动的化合物,具有广泛的应用价值。目前对甾体功能的研究已深入到分子层面,但仍有很多问题亟待解决,如甾体分子生物活性的分子机制,甾体药物的副作用与多效用等。要深入研究以上问题,急需确定甾体的活性靶标。通过传统的实验方法系统地筛选甾体靶标会耗费大量的时间和财力,利用分子模拟方法虚拟筛选出潜在的候选靶标可以降低寻靶的盲目性,缩小用于分子实验的候选蛋白范围,提高筛选效率。尽管目前已有一些在线小分子靶标预测工具,但由于精度低、周期长、假阳性高等原因,预测结果不能提供有价值的参考。为了更精确地预测甾体靶标,本研究构建了一种利用反向分子对接进行甾体靶标预测的特异性靶标库,并以两类甾体分子为例进行预测精度评估和靶标预测研究,主要结果如下:(1)构建了利用反向对接方法进行甾体靶标预测的特异性靶标库,可用于所有甾体分子靶标的虚拟筛选。分别利用配体相似性及生物学过程从DrugBank和KEGG甾体通路中搜集筛选得到潜在靶标晶体共3275个,并将晶体结构根据蛋白种类聚为196类,提高了预测结果排序的有效性。对蛋白库蛋白进行功能分析发现其主要为结合蛋白及催化作用的酶。对每一类蛋白的结构冗余性分析发现,其中60类蛋白包含的晶体数多于5个,这些冗余的晶体构象在后续反向对接预测中变相考虑了蛋白的柔性。(2)利用反向分子对接方法,从靶标库中预测甘氨胆酸的靶标,基于预测结果检验靶标库的覆盖度和预测精度。甘氨胆酸已知靶标有7个,其中4个有晶体结构的靶标能够被成功预测,且排序均位于前40位;3个靶标由于无晶体结构及同源序列,暂时无法预测。而在线预测工具idTarget仅预测出了其中两个靶标,且排序十分靠后(615;2583)。这一结果表明,本靶标库的靶标覆盖度及预测精度较好。其次,通过结合模式分析,发现甘氨胆酸与其中三个靶标(FXR,VDR,GT)在活性位点与原配体占据的空腔位置一致,且参与氢键形成的氨基酸残基相同。甘氨胆酸分子另一个靶标(PXR)的结合模式与原配体表现出差异,为了进一步确认这种结合模式的动态稳定性,动力学分析发现其均方根差(RMSD)稳定在2埃以内,说明结合过程中复合物构象较为稳定。(3)在利用本靶标库预测24-表油菜素的潜在靶标时,植物中的已知靶标BRI1-BAK复合物在预测结果中排序第一,再次说明预测结果较好。对于其他预测出的前10%的靶标,根据疾病相关性选出了5类蛋白做进一步的结合模式比较分析,并选择了结合力较强的两类蛋白(P450家族和G偶联受体蛋白)中的两个晶体(3swz,4jkv)做动力学模拟进行稳定性分析,发现复合物主链RMSD都稳定在2埃以内,说明复合物构象稳定。此外还发现SMO蛋白的跨膜区域在动态分析中比较保守,但膜两侧的蛋白片段稳定性不同。推测可能与小分子结合过程中的构象诱导变化相关,故SMO蛋白极有可能是24-表油菜素内酯的抗癌靶标。