论文部分内容阅读
定量结构-活性关系(Quantitative Structure-Activity Relationship,QSAR)方法是目前国际上一个活跃的研究领域,QSAR的研究对象包括化合物的生物活性、毒性、药物的各种代谢动力学参数和生物利用度以及分子的各种物理化学性质和环境行为等,研究领域涉及生物、化学以及环境科学等诸多学科。QSAR方法从化合物的分子结构和活性/性质的实验结果出发,依据不同需要和研究深度,可建立相关的二维、三维或多维模型,推论出化合物某些性质的影响因素,并估测未知化合物的生物活性和生态学效应。本论文第一章主要介绍了QSAR方法的发展历史、基本原理、方法及研究进展。论文第二章主要从99个鬼臼毒素衍生物的抗癌(KB)活性数据ID50出发,采用比较分子场分析(CoMFA)和比较分子相似因子分析(CoMSIA)方法系统地进行了三维定量构效关系(QSAR)研究。所得CoMFA和CoMSIA模型的交叉验证系数(q2)分别为0.644和0.764,非交叉验证相关系数(r2)为0.930和0.964,标准偏差(S)0.134和0.096,对预测集的预测值与实验值线性相关系数为0.706和0.683。论文第三章针对兰州大学化学化工学院自主设计合成的38个鬼臼毒素衍生物对肺癌肿瘤细胞(A-549)的细胞活性抑制率采用比较分子相似因子分析(CoMSIA)方法建立了三维定量构效关系模型,模型的交叉验证系数为0.665,非交叉验证相关系数(r2)为0.993,最佳主成分为4,该模型对测试集化合物预测值与实验值对比图的线性相关系数(R2)为0.946。论文第二、三章获得的模型初步解释了已知化合物的活性,提出的一些观点丰富并充实了对鬼臼毒素抗癌机理的理解,也为设计新的化合物提供了有益的思路和参考。近些年来,由于支撑向量机(Support Vector Machine,SVM)在机器学习方面的卓越性能,对其的关注也越来越多。本文第四章在文献采用B3LYP-SVM方法(利用SVM方法校正B3LYP/6-311G(3df,2p)计算结果)预测分子生成焓取得成功的基础上,对分子原子化能的理论计算做出尝试。对250个分子298K时原子化能计算的平均绝对误差(Mean Absolute Deviation,MAD)和最大误差(MaximumDeviation,MD)分别为2.079 kcal/mol和11.358 kcal/mol,极大减小了单纯B3LYP方法(MAD和MD分别为12.70kcal/mol和157.02kcal/mol)的计算误差。该预测原子化能的模型方法简单易行、花费少、预测精度高,并且具有良好的泛化能力,达到了预期目标。