论文部分内容阅读
近年来,药物研发面临着“高投入,低产出”的困境。定量构效关系(QSAR)可以快速建立化合物结构与性质之间的联系,从而指导化合物的优化,提高药物研发的效率。有效地表征分子是QSAR模型成功的关键。本论文中,我们提出了两种基于配体相似性向量的分子表征方法,并将它们应用到多个QSAR分析实例中。首先,以KEGG配体库中2000个多样性的化合物为基准,通过分子二维相似性算法,计算了目标化合物与基准化合物的相似性谱,称为生物相关谱(BRS)。BRS反映了化合物在生物相关化学空间中的分布。我们利用BRS构建了化合物药代动力学性质和毒性(ADME/T)的预测模型。(1)使用SVM方法分别构建了5组化合物急性毒性和2组化合物水生生物毒性的预测模型。在急性毒性模型中,训练集10重交叉验证的Q2取值范围为0.543~0.655,测试集的R2取值范围为0.566~0.840;在水生生物毒性模型中,呆鲦鱼和梨形四膜虫体系测试集的总体预测准确率Qtotal均在90%以上,马修相关系数MCC均在0.7以上。(2)分别构建了化合物血脑屏障透过率(BBB)、人体小肠吸收率(HIA)和P-糖蛋白(P-gp)抑制剂的预测模型。在BBB拟合模型中,测试集的R2为0.762,RMSE为0.41。HIA判别模型中,测试集总体的预测准确率为98%,MCC为0.789,模型对634个口服药物的预测准确率为93.8%。P-gp判别模型中,测试集总体的预测准确率为78.1%,MCC为0.537。结果表明,BRS在化合物ADME/T性质预测中表现出了接近或优于传统描述符的预测能力。继而,我们将生物相关谱的研究提高到了三维的层次,建立了三维生物相关代表性化合物数据库(BRCD-3D),通过分子叠合实现了三维生物相关谱(BRS-3D)的计算,并将其用于重要药物靶标配体选择性的预测中。(1)基于ChEMBL中的生物活性数据,我们对雌激素受体(ER)的选择性进行了研究,一共构建了4种类型的预测模型,包括亚型间的选择性拟合模型、单一亚型的活性拟合模型、亚型间的选择性判别模型和单一亚型的功能选择性判别模型。大多数模型表现出了理想的预测能力。此外,BRS-3D在ER选择性预测中的效果要优于MOE中传统的二维和三维描述符,组合BRS-3D和传统的二维描述符对于提高模型的预测能力有一定的帮助。(2)对两种重要的G蛋白偶联受体,大麻素受体(CB)和多巴胺受体(DR)的选择性进行了研究。在CB选择性预测中,基于Ki和IC50活性数据的模型表现出了理想的预测能力。对比不同描述符发现,BRS-3D在CB选择性预测中的效果要优于SubFP和MACCS分子指纹,与两种经典的三维描述符3D MoRSE和GETAWAY相当。在DR亚型选择性预测中,我们基于Ki活性的数据,构建了5组两两亚型间的选择性拟合模型和4组选择性判别模型以及D2、D3、D4三个亚型间的选择性多分类模型,模型均表现出了理想的预测效果。此外,我们挑选出了BRCD-3D中对区分各亚型选择性分子有重要作用的模板分子,可以为选择性化合物的研究提供有效地指导。综上所述,基于配体相似性谱的方法可以有效地表征分子,并建立具有较强预测能力的ADME/T和选择性的QSAR模型。其中,二维方法(BRS)具有快速、准确的优点,但无法实现骨架迁越。三维方法(BRS-3D)摆脱了二维拓扑结构的限制,可以实现骨架迁越,并且能够考虑小分子取得不同构象的能力,在与分子构象变化相关的体系中表现出了一定的优势,但存在计算速度较慢、局部药效特征表征能力不足等缺点。在药物设计中,可以将二维和三维方法进行合理的组合,并结合药效团特征,以提高虚拟筛选的效率。