论文部分内容阅读
生物降解,即环境中的微生物通过氧化、还原和水解作用破坏化学物质的分子结构或者将其矿化来有效去除有机质的过程。生物降解是清除环境污染的重要方法。由于环境中不易生物降解化合物的累积会对人类和生态构成潜在威胁,因此生物降解性已经成为评价化学物质对环境影响的重要指标。建立科学有效的生物降解性评价方法,对控制污染具有重要意义。相对于耗时且高成本的实验测试来说,用理论预测的方法对化学物质的生物降解性进行评测已经受到人们越来越多的关注和重视。 在本文的研究中,我们基于547个易生物降解化合物和1178个不易生物降解化合组成的大样本数据集对生物降解性进行了系统的理论预测研究。首先,我们采用了基于32个重要的物理化学性质和多种重要的子结构对数据集中的化合物进行生物降解性评测。我们发现,基于任何一种简单的分子性质和分子结构规则下,都不能对易生物降解和不易生物降解化合物进行有效区分。同时,我们仍然发现二者之间还是存在着一定的结构和性质的差异。相较于不易生物降解化合物,易生物降解化合物通常结构简单、分子量小、分子柔性大且更加亲水。同时,易生物降解化合物结构中的极性基团和环状子结构系统都较少。 其次,我们采用朴素贝叶斯分类方法来构建更加准确可靠的定量预测模型来对易生物降解化合物和不易生物降解化合物进行分类。基于21种重要的化学物质的物理化学性质、76个VolSurf描述符和LPFP_4结构指纹所构建的贝叶斯分类模型有着最优的预测精度。预测模型对训练集化合物的分类敏感性为0.877,特异性为0.864,全局预测精度为0.869,C值为0.720,AUC值为0.890。同时,我们发现,基于分子性质、VolSurf描述符和LPFP_6分子指纹所构建的贝叶斯模型对测试集Ⅰ的分类效果最好,AUC值为0.921。基于分子性质、VolSurf描述符和ECFC_6、ECFC_8或LPFC_4分子指纹所构建的分类模型对测试集Ⅱ的分类效果最好,AUC值为0.901。 最后,我们重点分析并讨论了由分类效果最好的贝叶斯模型所产生的20个对生物降解性有利和不利的分子结构片段对化学物质生物降解能力的影响。我们相信基于本课题的研究结果对发现和设计有着很好降解性能的化学物质具有重要的指导意义。