论文部分内容阅读
环境内分泌干扰物(雌激素干扰物、雄激素干扰物、甲状腺激素干扰物等)对人类和生态系统造成了严重的危害。甲状腺激素干扰物(TDCs)可以干扰人类或动物内分泌系统的正常生理功能,从而对生长、代谢和发育等过程造成潜在危害。因此,从众多化学品中筛选TDCs,对于化学品的生态风险评估和环境管理具有重要意义。然而,目前在美国化学文摘社注册登记的化学品已超过六千万种,且逐年增长。通过实验方法筛选TDCs,具有时间尺度滞后,费用昂贵等问题。因此,有必要建立化学品甲状腺激素干扰效应的理论预测方法。本研究基于Dragon, Discovery Studio和MOPAC2009等软件计算得到的分子结构描述符,采用遗传算法作为变量筛选方法,建立了甲状腺激素受体a和p两种亚型104个配体分子结合力的多元线性回归模型(MLR)、偏最小二乘模型(PLS)和支持向量机模型(SVM)。使用多种方法对建立的模型进行了全面的评价,包括内部和外部验证、Y-scrambling检测、QUIK rule检测和应用域表征。MLR, PLS和SVM模型都表现出较好的拟合优度、稳健性和预测能力。其中SVM模型性能最佳,PLS模型略好于MLR模型。对于TRα和TRp两种受体,SVM模型决定系数分别为0.87和0.84,内部交叉验证系数分别为0.79和0.79,外部验证系数分别为0.79和0.89。因此模型可以快速准确地预测应用域内化合物的结合力。对模型进行机理解释,发现配体分子与α和β两种受体的结合力主要受到最负羟基氧原子电荷的影响,并且与分子的体积,质量和极化率的有关。本研究为揭示影响配体分子结合力的结构特性提供了有用信息。