QSAR中不同建模方法的比较研究及其在环境科学中的应用

来源 :兰州大学 | 被引量 : 0次 | 上传用户:yushion
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着城市化过程的加快以及经济的快速发展,成千上万种化学物质被排放到环境中,化学物质的环境危险性评价显得越来越重要。计算机科学、统计学、物理有机化学、生物学等相关学科的发展,定量结构-活性/性质关系(Quantitative Structure-Activity/Property Relationship, QSAR/QSPR)方法的出现为有机物的环境风险性评价提供了一个重要的、不可缺少的手段。建立准确、高效的定量结构-活性/性质关系模型,不仅可以定量地预测有机污染物在环境中的迁移、转化行为,而且可以避免实验研究的滞后性,是“预防污染”的基础和前提,因此具有重要的理论及实际意义。本论文以持久性有机污染物和典型毒害有机污染物为研究对象,比较了不同QSAR/QSPR研究中的不同建模方法,本论文分为以下四章:第一章简述了有机污染物的环境风险评价、定量结构性质关系及其研究进展。第二章以64个持久性有机污染物(POP)为研究对象,基于三种不同的建模方法遗传算法-多元线性回归,最小二乘支持向量机,局部建模建立了用于预测持久性有机污染物土壤吸附系数的定量结构性质关系模型。局部建模方法给出了最优的结果,训练集和测试集的相关系数的平方(R2)分别为0.894和0.860,交叉验证系数(Q2)为0.860。说明所建模型具有良好的预测能力和较强的稳健性,可以用于有机污染物的土壤吸附系数的预测。论文第三章,基于密度泛函理论B3LYP方法获得准确的分子三维结构信息,建立了预测70个多氯联苯的有机碳吸附系数的定量结构性质关系模型。通过遗传算法选择合适的描述符,基于多元线性回归方法和最小二乘支持向量机方法建立相应的线性和非线性模型。通过比较不同的结构优化方法,发现相对于半经验的量子化学方法,基于B3LYP方法得到的三维分子结构建立的QSPR模型具有较好的预测结果。第四章将遗传算法(GA)与最小二乘支持向量机(LSSVM)相结合用于定量结构性质关系研究中描述符的选择和模型的建立,用于96个有机杀虫剂的结构与亨利常数之间定量关系模型的建立。比较以往的遗传算法-多元线性回归(GA-MLR)方法选择的描述符,GA-LSSVM方法给出更好的结果。遗传算法-最小二乘支持向量机方法建立的模型,对于训练集R2=0.785, Q2=0.637, RMSE=1.010,对于测试集预测的R2为0.734, RMSE为1.171。说明遗传算法-最小二乘支持向量机(GA-LSSVM)是一种具有潜力的描述符选择和模型建立方法。
其他文献
目的探讨急性主动脉夹层早期临床特征,提高急性主动脉夹层早期的临床诊治水平。方法回顾分析11例急性主动脉夹层的临床资料,分析其早期临床特征及诊疗手段。结果 11例中5例(D
黄曲霉毒素M1(AFM1)是由黄曲霉毒素B1(AFB1)在动物体内代谢产生的,是一种毒性极强的物质,主要表现在致癌性和致突变性。在实际生产中常通过检测AFM1来判定牛奶是否被黄曲霉毒素污
通过固体分散体技术采用熔融硬脂酸包裹进行掩味,制备出口感较好的干混悬剂,并符合中国药典要求。采用硬脂酸为掩味材料,加热熔融后混入头孢呋辛酯制备成固体分散体,再进行干
目的:探讨生血宝合剂治疗上消化道出血伴贫血的临床疗效。方法:回顾性分析2015年1月~2017年12月在广东省第二中医院脾胃科收治的上消化道出血伴贫血患者140例,并随机分为对照
采用三元乙丙橡胶(EPDM) 与高介电常数陶瓷粉复合制备高介电常数低损耗复合电介质薄膜,解决聚丙烯—陶瓷复合电介质膜发脆问题。对EPDM 和不同陶瓷粉体的复合进行了较系统的研究,对影响复
选择生物质吸附材料泥炭、木屑、花生壳、稻壳、山竺壳、玉米芯、甘蔗渣作为吸附剂并对其进行构型改性,考察改性前后对水中双酚A(BPA)、壬基酚(NP)和四溴双酚A(TBBPA)三种内
2006年我们进行了中华倒刺鲃成鱼饲养试验,现将研究结果报告如下,供同行参考。一、材料与方法1.鱼池5口较规范的成鱼养殖池,其中1 In 2006 we conducted a Chinese barbed b
射频能量捕获无线传感器网络可以通过不同物理环境和不同需要条件如时间、频率、能量源的发送能量功率等维度上进行充分的控制,稳定性较强,而其中的基站不仅具有较高的成本,
站在法哲学的高度,立法的对象应该是外在的行为、行为的负价值、行为的可操作性、行为的主体间性。"醉驾"满足这四个条件,而"常回家看看"并不满足第二、三个条件。一部新的法