论文部分内容阅读
目前,随着合成工业的不断发展,苯酚及其衍生物被广泛地用作化工原料。因其具有明显的生物毒性、内分泌干扰性和生物富集作用,成为普遍存在的污染物,对人类及其它动植物带来一定的危害,这就使对其生态毒性进行风险评估的研究有了一定的价值。随着研究的深入,为了节省时间和金钱,了解毒性机理,模拟非合成化合物的生态毒理学行为,同时满足公众反对动物测试的呼吁,定量结构-毒性相关(Quantitative Structure-Toxicity Relationship,QSTR)研究在环境科学领域已取得了多项成果,故有必要开展以QSTR方法建立苯酚及其衍生物毒性模型的研究。在20世纪90年代后期,发现了一种测试生物毒性的新方法——梨形四膜虫毒性测试法。该测试方法检测速度快、方法操作简单、经济实惠、应用的范围广范,因而在药物、有机物、无机物、水污染物等方面广泛用于毒理学评价。本文在查阅大量文献的基础上,选取了258个苯酚及其衍生物对水生梨形四膜虫的毒性数据,结合软件筛选出的7个分子描述符作为建模的结构参数,分别采用多元线性回归(MultipleLinear Regression,MLR)、偏最小二乘(Partial Least Squares,PLS)、BP(BackforwardPropagation,BP)神经网络三种方法进行定量构效关系研究。本文主要工作包括:(1)介绍了本文运用的相关化学计量学方法,如多元线性回归、偏最小二乘、BP神经网络、主成分分析(Principal Component Analysis,PCA)等的基本原理。(2)利用ADMEWORKS ModelBuilder软件(Version4.5Standard)计算并筛选了258个苯酚及其衍生物的分子描述符,最后选出7个描述符作为建模变量。(3)运用稳健诊断方法(Robust Diagnostic Method)剔除24个奇异样本,继而采用球排除算法(Sphere-exclusion Algorithms)将样本合理划分为多个训练集与内部测试集,同时要求内部测试集和外部验证集均匀分布在PC空间的整个区域内,最终划分为3类合理的样本。(4)结合取自文献的毒性数据,分别采用多元线性回归、偏最小二乘、BP神经网络方法进行QSTR研究,成功建立了毒性预测模型,并对外部验证集采用共识建模方法(Consensus Modeling Method),从而提高模型的预测能力。根据QSTR研究结果分析表明,所建模型均具有较好的预测能力和稳定性,且与MLR、PLS模型相比,BP神经网络模型性能略胜一筹,即非线性模型比线性模型性能优越。但是BP神经网络建立的模型不能直接给出直观的数学模型和公式,而MLR、PLS模型更为简单明了。本文建立的QSTR预测模型,实现了只需知道苯酚及其衍生物的分子结构式,而不用做实验就可以合理预测其毒性数据。