论文部分内容阅读
尽管成本逐年增长、过程复杂漫长,新药研发依然面临着临床试验失败率高的挑战。为了解决这一难题,药物发现模式正在从传统的“一个药物→一个靶标→一种疾病”的线性模式,转向“多个药物→多个靶标→多种疾病”的网络模式。药物—靶标相互作用的系统性识别,在这种基于网络的模式下扮演了重要角色。然而,通过实验方法确定药物—靶标相互作用昂贵而耗时。在过去的十余年里,基于结构、基于配体、基于网络等各种计算方法的出现,使得低成本、高效率的药物—靶标相互作用识别成为可能。这些方法中,基于网络的方法虽然具有不依赖于靶标三维结构和阴性样本的显著优势,但是却不能为新合成的化合物、新提取的天然产物等没有已知靶标的全新化学实体预测潜在靶标。这一缺陷严重限制了基于网络的方法的应用范围。本论文中,我们旨在发展新型基于网络的药物—靶标相互作用预测方法,并且将其应用于癌症这一严重威胁人类健康的复杂疾病的药物发现研究。论文主体由如下两个部分组成。第一部分的主要内容是基于网络的方法发展,包括第二章和第三章。在第二章中,我们发展了一种名为基于子结构—药物—靶标网络推理(SDTNBI)的方法。该法通过引入化学子结构,沟通了已知药物—靶标相互作用网络和网络之外的全新化学实体,解决了基于网络的方法不能为全新化学实体预测靶标的缺陷,极大拓展了此类方法的应用范围。采用SDTNBI方法构建的预测模型在系统性评价中显示出了良好表现。通过使用SDTNBI方法,我们发现非甾体抗炎药可能通过靶向AKR1C3、CA9以及CA12等癌症相关蛋白发挥抗癌效果。在第三章中,我们通过对SDTNBI方法引入三个可调节参数,发展了一种改进的基于网络的方法,名为平衡的基于子结构—药物—靶标网络推理(bSDTNBI)。这一方法在系统性评价中显示了比SDTNBI方法更好的表现。通过使用bSDTNBI方法,我们构建了一个针对15种癌症类型的全局药物—基因—疾病网络,并且基于该网络,解释了三环类抗抑郁药物和抗糖尿病药物可能的抗癌机制。为了显示bSDTNBI方法的实际应用价值,我们结合bSDTNBI方法与相似性搜索,为乳腺癌靶标雌激素受体α(ERα)预测了可能的配体。体外生物实验结果显示,我们购买的56个化合物中,有27个是潜在的ERα激动剂或拮抗剂(EC50或IC50 ≤ 10 μM)。其中的ERα拮抗剂,可能具有一定的抗乳腺癌效果,展示了 bSDTNBI方法在核受体配体发现中的实际应用价值。此外,在这两章中,我们还使用C++开发了一个名为NetInfer的工具包。该工具包可以在统一的平台下,为用户提供基于网络的药物—靶标相互作用预测、交叉验证和外部验证服务。SDTNBI方法、bSDTNBI方法以及一种之前报道的名为基于网络推理(NBI)的方法,都被收录到该工具包中。第二部分的主要内容是将发展的方法应用于抗癌药物发现研究,包括第四章和第五章。在第四章中,我们使用NBI、SDTNBI和bSDTNBI方法,为人类G蛋白偶联受体(GPCR)构建了全局和局部预测模型,用于进行GPCR配体的多向药理学研究。其中的全局模型,可以在不使用三维结构的情况下,为200个人类GPCR预测潜在的药物一靶标相互作用。我们使用表现最好的全局模型,为癌症的潜在靶标前列腺素E2受体EP4亚型(EP4)预测了可能的配体。体外生物实验结果显示,我们购买的20个化合物中,有2个是潜在的EP4拮抗剂(IC50 ≤ 10 μM),意味着我们基于网络的方法可以为靶向GPCR的药物发现提供帮助。在第五章中,我们构建了一个能够覆盖1799个人类靶标蛋白(包括39个核受体)的规模更大的全局药物一靶标相互作用网络,然后使用NBI、SDTNBI和bSDTNBI方法构建了基于网络的预测模型。在系统性评价中,一种名为FCFP4的扩展连通性指纹,显示了比基于预先定义子结构字典的普通分子指纹更好的表现,并且还有一些预测结果得到了文献验证。结合表现最好模型的预测结果以及体外生物实验,我们为前列腺癌的潜在靶标维甲酸相关孤儿受体γ(RORγ),从天然产物中发现了 5个拮抗剂(IC50小于或约等于10μM)。其中,2个拮抗剂的IC50<0.5μM。此外,我们还获得了其中一个拮抗剂与RORγ的复合物晶体结构。这些结果又一次展示了我们基于网络的方法在核受体配体发现中的实际应用价值。综上所述,我们发展的基于网络的新方法,可以有效地为上市药物和全新化学实体发现新靶标,为药物发现(尤其是抗癌药物发现)提供了有力工具。最后一章对全文进行了总结,凝练了创新点,指出了论文尚存在的不足之处,并且对未来的发展进行了展望。