论文部分内容阅读
利奈唑胺(Linezolid1)和伊皮唑胺(Eperezolid2)以其独特的作用机制抑制多重耐药的革兰氏阳性菌和部分革兰氏阴性菌,为一类全新合成的噁唑烷酮类抗菌剂。研究其抗菌活性定量结构-活性关系(QSAR),以用来预测类似化合物的活性、实现对药物的分类和控制以及临床治疗药物的研发是很有必要的,具有现实的理论指导意义。本文以两类噁唑烷酮类化合物作为研究对象,在其优化结构的基础上,用半经验方法中的AM1法计算得到了其较为精确的量子化学参数;应用DRAGON软件计算了3DMORSE描述符,使用多种化学计量学方法对其进行了QSAR研究,获得了一些比较满意的模型。 1、通过HyperChem软件采用半经验方法中AM1法,计算了110个噁唑烷酮类化合物的24种电子结构参数,并通过DRAGON软件计算了包括3D参数在内的160余种参数。 2、从60个噁唑烷酮类化合物随机选出52个化合物为训练集,用逐步回归筛选出对其抗菌活性影响显著的10个变量,即HE、LogP、Mor11v、Mor3p、Mor26u、Mor4V、Mor4p、Mor23m、Mor15m、Mor8p建立回归方程:Log(1/C)=0.011HE+0.545LogP-4.551Mor3p+0.738 Mor11v-1.990Mor26u+6.022Mor4V-4.215Mor4p+2.145Mor23m+0.468Mor15m+1.292Mor8p+0.376其相关系数为R=0.926,标准偏差为Std=0.28。用留一法对方程进行交互检验,复相关系数为 R2cv=0.7804,表明该线性模型具有良好的稳定性。用所建回归方程对8个样品的抗菌活性进行预测,预测效果良好,表明该线性模型具有良好预测能力。由模型分析可得出(比较标准回归系数):Mor4V对噁唑烷酮类化合物的抗菌活性影响最大,在噁唑烷酮类化合物的实际应用中,为了尽可能使用抗菌活性较大的化合物,寻找正相关数值较大而负相关较小的值来增大其抗菌活性。 3、在60个噁唑烷酮类化合物中,选择52个样品为检测集,选择8个样品为预测集,将其显著10个变量作为径向基人工神经的输入,建立其RBFNN型QSAR模型。网络训练结果显示,回判预测误差为3.23e-0010,预测集样品的预测MSE为0.29,总体样本的预测MSE为0.0418,小于逐步回归分析结果的均方误差MSE,说明径向基网络具有较好的数值逼近能力,预测能力高。 4、在使得预测集的预测误差最小的基础上,选定偏最小二乘法主成分数为3,用上述52个样品的九个变量进行偏最小二乘建模,并对模型稳定性进行留一法对方程进行交互检验,复相关系数为 R2cv=0.6884,表明该线性模型具有良好的稳定性。 5、由于所选化合物样本容量较小,而支持向量机适合于小样本,对60个噁唑烷酮类化合物抗菌剂用支持向量机回归方法进行QSAR研究。本文采用的是第1类支持向量机回归,即Liner-SVR,不敏感函数值为0.003,惩罚因子为6,用52个样品作为训练集建立支持向量机回归模型,并将所得模型用留一法进行交互检验,复相关系数为RCV2=0.7647,表明该线性模型具有良好的稳定性。用所建回归方程对8个样品的抗菌活性进行预测,预测效果良好,表明该线性模型具有良好预测能力,体现出支持向量机回归对于小样本具有较强的泛化能力。 6.从50个噁唑烷酮类化合物随机选出45个化合物为训练集,用逐步回归筛选出对其抗菌活性影响显著的8个变量,即Mor3m、LogP、RMS、Mor22V、Mor5m、Mor21P、Mor15e、Mor27e建立回归方程:PMIC=0.605Mor3m+0.166LogP-0.919RMS-4.246Mor22V+0.472Mor5m-3.072Mor21P-0.773Mor15e+0.964Mor27e+11.019其相关系数为R=0.857,标准偏差为Std=0.265。用留一法对方程进行交互检验,复相关系数为 R2cv=0.5412,表明该线性模型具有良好的稳定性。用所建回归方程对8个样品的抗菌活性进行预测,预测效果良好,表明该线性模型具有良好预测能力。由模型分析可得出(比较标准回归系数):Mor22V对噁唑烷酮类化合物的抗菌活性影响最大,Mor3m、RMS、Mor21P、Mor15e、Mor5m、Mor27e对噁唑烷酮类化合物的抗菌活性影响依次减小,LogP为最小。说明这些变量中,Mor22V、Mor3m对噁唑烷酮类化合物的抗菌活性起决定的作用。 7、在50个噁唑烷酮类化合物中,选择45个样品为检测集,选择5个样品为预测集,筛选7个变量作为径向基人工神经的输入,建立其RBFNN型QSAR模型。网络训练结果显示,回判预测误差为1.89e-0028,预测集样品的预测 MSE为0.2046,总体样品的预测MSE为0.0210,小于逐步回归分析结果的均方误差MSE,说明径向基网络具有较好的数值逼近能力,预测能力高。 8、在使得预测集的预测误差最小的基础上,选定偏最小二乘法主成分数为5,用上述45个样品的八个变量进行偏最小二乘建模,并对模型稳定性进行留一法对方程进行交互检验,复相关系数为 R2cv=0.5844,表明该线性模型具有良好的稳定性。 9、由于所选化合物样本容量较小,而支持向量机适合于小样本,对50个噁唑烷酮类化合物抗菌剂用支持向量机回归方法进行QSAR研究。本文采用的是第1类支持向量机回归,即Liner-SVR,不敏感函数值为0.094,惩罚因子为100,用45个样品作为训练集建立支持向量机回归模型,并将所得模型进用留一法对方程进行交互检验,复相关系数为RCV2=0.6483,表明该线性模型具有良好的稳定性。用所建回归方程对5个样品的抗菌活性进行预测,预测效果良好,表明该线性模型具有良好预测能力,体现出支持向量机回归对于小样本具有较强的泛化能力。