论文部分内容阅读
近年来,随着计算机技术的发展应用以及信息科学的突飞猛进,应用计算机辅助的方法研究药物分子的定量结构活性关系(Quantitative Structure-Activity Relationship, QSAR)及其与生物大分子的相互作用已经成为一个热点领域。从最早的Hansch方法诞生至今,计算机辅助药物分子设计方法已经发展成熟,应用已经非常广泛,取得了丰硕的成果。计算机辅助药物分子设计方法大体可以分为两类:基于配体结构的方法和基于受体结构的方法。前者主要研究药物小分子的结构特征与其生物活性之间的内在联系;后者则从药物分子与生物大分子相互作用的角度出发,通过更为全面的信息寻找药物产生活性及活性大小的分子机制。在本论文中,针对基于配体结构的方法,我们探讨了分子构象和建模方法等因素对药物活性预测准确度的影响;同时,也将基于受体结构的方法与基于配体的方法有效地结合起来,以提高模型预测的准确度。论文第一章对定量结构活性关系方法、同源模建、分子对接以及分子动力学模拟方法做了简单介绍。从分子结构的表示、描述符的计算和选择、数据集的划分、模型建立、模型验证、模型应用域以及模型解释等方面,详述了QSAR研究的每一个步骤。同时,介绍了同源模建、分子对接以及分子动力学模拟方法的基本原理以及实现方法。论文第二章首次提出了将自相关方法应用于描述寡核苷酸的序列结构,计算出了寡核苷酸的碱基序列自相关(base sequence autocorrelation, BSA)描述符,不但可以表示序列的组成、拓扑、电荷、立体等结构信息,还可以在一定程度上反映二级结构信息。在这些描述符的基础上,利用遗传算法选择描述符并建立30℃、40℃、50℃、60℃和80℃下的单温度多元线性回归模型,得到了令人满意的结果。此外,为了能够预测多温度下寡核苷酸的保留时间的模型,我们还建立了多温度预测模型,多温度预测模型对各个温度下保留时间的外部预测相关系数(R2)分别为0.978、0.982、0.989、0.988和0.996,绝对平均相对偏差(absolute average relative deviations, AARD)均低于1%。该工作表明新的自相关特征描述方法能够充分地表示寡核苷酸的序列结构特征;多温度预测模型的建模策略不仅可以达到精确预测多温度下样本的保留时间的目的,且预测精度较单温度模型还有进一步提高。论文第三章,我们比较了两种全局建模方法(多元线性回归与支持向量机)和一种局部建模方法(local lazy regression, LLR)模型的预测结果,证明局部建模思想能够有效地提高模型的质量。同时,基于不同模型对不同化合物的预测精度存在差异,采用三种一致性建模策略建立一致性模型来提高预测精度,分别是平均一致性模型(average consensus model, ACM)、简单加权一致性模型(simple weighted consensus model, SWCM)和hat加权一致性模型(hatweighted consensus model, HWCM)。结果表明,本工作中新提出的hat加权一致性建模策略优于其它两种一致性模型和最优的LLR单个模型。论文第四章研究了构象对QSAR模型预测能力的影响。本工作采取分子对接方法获得一系列新的原卟啉原抑制剂的活性构象,在这些分子对接引导的活性构象的基础上计算分子结构描述符,用遗传算法选择与活性相关的重要描述符并建立多元线性回归模型,所建立的模型具有好的内部和外部预测能力,对训练集和测试集的预测相关系数(R2)分别高达0.972和0.953,AARD分别为2.24%和2.75%。因此,分子对接引导的活性构象选择策略可以有效提高模型质量,提高预测精度。论文第五章主要研究了在三维定量构效关系方法CoMFA和CoMSIA中模板分子构象以及不同场的组合对模型预测结果的影响。本工作研究对象为一系列丙型肝炎病毒NS5B聚合酶的噻唑酮类变构位点抑制剂,选取了两种方法获得模板构象:一种为最低能量构象,另一种为X射线晶体结构中获得的活性构象。另外,考察了CoMSIA模型中立体场、静电场、疏水场、氢键给体和氢键受体场不同组合情况下模型质量的变化。结果表明,模板构象为X射线晶体结构中活性构象的CoMFA和CoMSIA模型均优于最低能量构象,说明合理的构象选择方法应为活性构象;另一方面,CoMSIA模型最佳场的组合并非越多越好,过多的冗余信息可能导致模型结果变差。本工作中最优的组合是立体、静电和氢键受体三个场,这也与药物分子与蛋白相互作用的方式相吻合。最优的CoMFA和CoMSIA模型对训练集的51个化合物的交互检验系数分别为0.621和0.685,预测相关系数分别为0.950和0.940;对测试集的16个化合物的预测相关系数分别为0.685和0.822。显然,CoMSIA模型优于CoMFA模型,是因为CoMSIA模型中氢键受体场反映了该系列分子与NS5B相互作用的重要信息,这一点可以通过模型的场等高线图解释,而从等高线图中得到的直观的对提高活性有利的结构信息能够为设计新的抑制剂提供有力指导。论文第六章主要用同源模建、分子对接、分子动力学模拟以及MM-PBSA (molecular mechanics Poisson-Boltzmann surface area)结合自由能计算等分子模拟方法研究了UK101(α’,β’-epoxyketone peptide)与免疫蛋白酶体LMP2催化域和蛋白酶体β5催化域相互作用的选择性机理。免疫蛋白酶体抑制剂是新表征的治疗多种疾病的有效靶标,选择性的抑制免疫蛋白酶体的催化域可以有效降低药物毒性。根据分子模拟结构所计算的结合自由能与实验值在定性关系上完全一致;通过分析UK101与LMP2和β5的相互作用,我们找出了UK101对LMP2的选择性来自于该分子N端的线状长链疏水基团以及C端的环氧基团上的大体积取代基,原因是LMP2有一个疏水口袋与N端长链疏水基团有很强的相互作用,而C端大的取代基与β5的Tyr169有不利的位阻效应。这一选择性机理发现对于将来设计LMP2特异性抑制剂具有重要意义。另外,用分子对接方法研究了一类可逆共价结合LMP2抑制剂的结合模式,并对其结合能力进行了预测,预测结果与实验值具有非常好的相关关系;根据结合模式分析得到的有用信息,对已有分子结构进行改进,设计了一系列新的抑制剂分子,并用已经建立好的对接方法对新的抑制剂分子进行分子对接研究和结合能力预测,其预测活性确实优于已知活性最高分子,说明了通过改进配体分子基团,使其与活性位点疏水口袋更好地匹配,可以提高分子活性,为进一步设计高活性LMP2抑制剂分子提供了重要信息。