论文部分内容阅读
染料在很多领域例如纺织业、印刷业、医疗保健行业以及能源行业等均有广泛的应用,并在这些领域内发挥着越来越重要的作用。随着时代的发展,各种具有特定功能的染料不断涌现,这些染料都必须具备合适的性质,诸如酸碱度、良好的热稳定性、良好的牢度与强度等。因此,迫切需要计算机设计手段来满足设计的需求。本论文首先对近二十年来定量构效关系在染料活性/性质方面的研究做了综述。然后,用多元线性回归方法(MLR)和径向基函数神经网络方法(RBFNN)建立了多种染料重要性质的QSAR/QSPR模型,以期为合成和发现新的染料提供理论帮助。本论文主要分为以下几个部分: 第一章:综述了1995年至2011年间用定量构效关系方法来研究染料活性/性质,并论述了QSAR/QSPR研究方法及进展。 第二章:用多元线性回归(MLR)和径向基函数神经网络方法(RBFNN)分别建立了191个偶氮苯染料和43个1,4-萘醌类染料的最大吸收波长(λmax)的QSPR模型。偶氮苯类染料MLR模型的统计参数为:训练集R2=0.893,R2adj=0.893,LOOq2=0.884,F=1214.871,RMS=11.6430;外部测试集R2=0.849,R2adj=0.845,q2ext=0.846,F=207.812,RMS=14.0919。RBFNN模型得到了更好的统计结果:训练集R2=0.920,R2adj=0.919,LOOq2=0.898,F=1664.074,RMS=9.9215;外部测试集R2=0.895,R2adj=0.892,q2ext=0.895,F=314.256,RMS=11.6427。1,4-萘醌染料的MLR模型的统计结果为:训练集R2=0.8887,LOOq2=0.8627,F=231.552,RMS=28.6358;测试集R2=0.8622,q2ext=0.8308,F=423.809,RMS=33.8613。这种理论方法可以提供一种简单、精确的方法来预测偶氮苯类和1,4-萘醌类染料的最大吸收波长。RBFNN模型训练集结果为R2=0.9524,LOOq2=0.7815,F=578.758,RMS=17.4988;测试集结果为R2=0.9231,q2ext=0.9202,F=84.010,RMS=25.3406。这种理论方法可以提供一种简单、精确的方法来预测偶氮苯类和1,4-萘醌类染料的最大吸收波长。 第三章:建立了一系列1,2-萘醌类衍生物作为蛋白络氨酸磷酸酶1B抑制剂的定量构效关系模型。建模是用多元线性回归和径向基函数神经网络两种方法分别建立。得到MLR模型的统计参数为训练集R2=0.8031,LOOq2=0.7010,F=85.638,RMS=0.3062;测试集R2=0.8775,qext2=0.7704,F=28.643,RMS=0.3004。RBFNN模型结果训练集R2=0.8544,LOOq2=0.6355,F=123.189,RMS=0.2264,测试集R2=0.9064,qext2=0.8282,F=38.753,QSAR模型外部测试集的结果精确,具有较好的预测能力,这个结果显示这种方法是一种简单、精确、可靠的方法,可以用于筛选具有较高抑制活性的1,2-萘醌衍生物。 第四章:建立经典2D-QSAR模型来预测1,4-萘醌衍生物的抗疟活性。建立起来的线性模型和非线性模型都经过了统计学验证(内部验证和外部验证)。内部验证用到的方法有留一法交互检验、留多法交互检验以及Y-随机测试,外部验证使用外部测试集的统计参数来验证。线性MLR模型结果为:训练集R2=0.7876,LOOq2=0.7068,RMS=0.3377;测试集R2=0.7648,q2ext=0.7597,RMS=0.2556,R02=0.7598,k=1.0417。RBFNN模型结果:训练集R2=0.8338,LOOq2=0.5869,RMS=0.2781;测试集R2=0.7586,q2ext=0.7189,RMS=0.2788,R02=0.7129,k=1.0284。结果发现最高占据分子轨道能与抗疟活性有高度的相关性。这是一种简单、精确、可靠的方法,可以用来筛选具有较高抗疟活性的1,4-萘醌衍生物。 第五章:采用QSPR方法建立了太阳能电池染料敏化剂最大吸收波长的线性与非线性模型。模型建立后,分别用内部验证和外部验证两种方法对模型的稳定性和预测性进行验证。多元线性模型的统计参数(训练集R2=0.8903,LOOq2=0.8412,F=54.1068,RMS=14.6419;测试集R2=0.8162,F=41.9710,RMS=18.5012)表明这是一个令人满意的、稳定的、具有较好预测能力的模型。非线性RBFNN模型的结果(训练集R2=0.9228,LOOq2=0.6436,F=537.510,RMS=11.4163;测试集R2=0.8257,F=42.639,RMS=18.8858)比线性模型的结果更好。研究结果表明两种模型都具有很好的稳定型和预测性,均可用于染料敏化剂最大吸收波长的预测。 第六章:用分子结构描述符分别建立QSPR模型分别预测了50个氧氮杂环化合物的香阈值与97个脂肪醇化合物的香阈值。用三种方法(线性的多元线性回归法、非线性的径向基函数神经网络法和支持向量机法)建立氧氮杂环化合物的QSPR模型。脂肪醇类化合物模型用了多元线性回归和径向基函数神经网络两种方法。得到的QSPR模型可以提供一种快速、简单、有效的方法来预测脂肪醇类和杂环类化合物的香阈值。