论文部分内容阅读
定量结构活性关系(Quantitative Structure-Activity Relationship, QSAR)的研究是化学计量学研究的的热点问题之一,同时也是生物信息学研究的一个活跃领域。它主要应用各种统计学方法研究化合物的结构与其性质(物理化学性质或生物活性)之间的关系。本论文从定量构效活性关系的建模方法入手,研究和探索了不同的建模方法在定量活性关系中的应用,着重讨论了非线性的支持向量机方法在定量构效关系建模中应用。本论文第一章综述了化学计量学研究的热点问题-定量构效关系,描述了定量构效关系的基本原理和研究现状,详细的介绍了定量构效关系研究的步骤及目前最为常用的定量构效活性关系的建模方法。本论文对常用的QSAR建模方法进行了以下三方面的研究。具体研究工作包括:1.胞浆型磷脂酶A2α是胞浆型磷脂酶A2(α,β和γ)三种亚型之一。对花生四烯酸产生途径中有着重要的作用。胞浆型磷脂酶A2α可以限制促炎介质的产生,成为药物开发的一个有吸引力的目标。研究表明吲哚衍生物的化合物,可以抑制胞浆磷脂酶A2α的活性。然而,有关吲哚衍生物抑制剂的分子结构与其抑制活性之间的研究却较少报道。在本章中,我们用定量构效关系方法研究了49个吲哚衍生物的分子结构和其对胞浆型磷脂酶A2α抑制浓度之间的关系。首先用逐步多元线性回归方法从1777个分子描述符中选择了具有代表性的5个分子描述符,这5个分子描述符分别是GGI5(Topologicalcharge index G5), TIE(dssC)(sum of E-State of atom type dssC:|2S(dssC)),RDF115a (the atomic Sanderson ALOGP), RDF100c (the atomic charge)和RDF065p (the atomic polarizability),随后,采用偏最小二乘法(PLS),人工神经网络(ANN)和支持向量机(SVM)三种方法分别建立QSAR模型,用独立的测试集分别检验这三个模型,结果表明SVM方法有着很好的预测能力,其模型也比较稳定。通过QSAR研究,我们可以得到吲哚衍生物抑制剂的活性可能与分子的全球的电荷转移,与苯磺基连接的碳原子类型和分子的几何距离分布有关。2.本章用定量构效关系研究了37个c-met激酶抑制剂的分子结构和抑制活性之间的定量关系。37个化合物被随机的分为训练集和测试集,其中30个分子训练集,剩余的7个分子为测试集。用逐步多元线性回归从在线的E-DRAGON软件计算的1666个分子描述符中挑选了6个具有特征代表性的分子描述符,用偏最小二乘方法建立了线性的模型,用人工神经网络和支持向量机方法建立非线性的模型。偏最小二乘、人工神经网和支持向量机建立的模型对测试集预测的相关系数R2分别为0.8204、0.8635、0.939,剩余标准偏差RMSE分别为0.1640、0.1807、0.0033。通过比较,我们可以得到支持向量机模型的性能优于人工神经网络和偏最小二乘方法建立的模型。3.我们用偏最小二乘方法和粒子群算法优化的支持向量机算法建立定量构效关系模型研究了39个N-苯甲酰化吩噁嗪和吩噻嗪类似物的分子结构和抑制浓度IC50之间的关系。采用Tropsha提出的模型统计参数的计算方法,计算两个模型的统计参数。通过比较,粒子群算法优化的支持向量机算法得到较好的统计参数。从而可以得出,粒子群算法优化的支持向量机算法具有良好的预测能力,是一种很有潜力的建模方法。