论文部分内容阅读
热安全在化工生产安全中占有极其重要的地位。本论文选择粘度、热容、热导率和自燃点这四个安全参数进行预测研究,对生产安全有着重要的理论意义和实用价值。基于QSPR (Quantitative Structure-Property Relationship)基本原理,构建了有机物粘度、热容、热导率、自燃点与其分子结构间的QSPR预测模型,探究影响其性质的结构因素。主要研究方法与结论如下:(1)采用Dragon 2.1软件计算化合物的分子描述符,以迭代自组织数据分析技术(Iterative Self-Organizing Data Analysis Techniques Algorithm, ISODATA)将样本集初步分类,随后在各个类别中随机选取样本作为训练集用于建立模型。分别运用遗传算法(Genetic Algorithm, GA)和蚁群算法(Ant Colony Optimization, ACO)获取特征描述符,并分析了特征描述符与其性质间的关系。将特征描述符作为模型的输入参数,分别与多元线性回归(Multiple Linear Regression, MLR)法和支持向量机(Support Vector Machine, SVM)法结合建立了GA-MLR、GA-SVM、ACO-MLR和ACO-SVM模型。采用模型评价参数对所建模型性能进行了全面的评价验证,应用Williams图对模型的应用域进行了研究,找出了标准残差和臂比值超出界定范围的化合物,并分析了出现“异常值”的原因。将所建预测模型与文献中已有模型进行比较,发现所建模型优于文献中已有模型。(2)对有机物粘度与其分子结构间的QSPR研究结果如下:ISODATA算法将310种化合物分成11类,选取248种化合物作为训练集建立粘度预测模型。GA和ACO筛选出的特征描述符均认为化合物的粘度值大小主要由化合物的溶解熵大小以及分子中亲水基团的数目所决定,且GA筛选出的nOH描述符明确指出是亲水基团中的羟基数目。所建立的四个粘度预测模型决定系数R2均在0.75以上,预测效果令人满意。其中,GA-MLR模型优于ACO-MLR模型,GA-SVM模型优于ACO-SVM模型,GA-MLR模型和GA-SVM模型的R2达到0.9左右,表明GA筛选出了对粘度有较大影响的特征结构。(3)采用相似的方法对有机物的热容进行了QSPR研究,结果如下:ISODATA算法将650种化合物分成16类,520种化合物作为训练集。由GA和ACO均获得5个特征描述符,且获得了一个对热容贡献度最大的相同特征描述符即SIK,该描述符主要反映杂化原子以及杂化状态对分子形状的影响程度。所建热容预测模型非常优秀,其R2均在0.90以上。通过模型的比较发现,GA-MLR模型优于ACO-MLR模型,GA-SVM模型优于ACO-SVM模型,GA-MLR模型和GA-SVM模型的R2达到0.95以上,预测结果非常满意。(4)同样地,对有机物热导率进行了QSPR研究。结果为:ISODATA算法将178种化合物分成10类,142种化合物作为训练集。GA筛选出的特征描述符主要反映分子中氟原子的数目、分子的极化率、原子对以及整个分子中的电荷转换、原子范德华体积大小等,以特征描述符作为输入参数,建立了GA-MLR和GA-SVM模型,其预测结果比较令人满意,R2均在0.70以上,且后者优于前者,说明SVM是一种可以快速、有效、准确预测有机物热导率的工具。(5)对有机物自燃点进行QSPR研究结果如下:ISODATA算法将265种化合物分成5类,212种化合物作为训练集。由GA获得的特征描述符主要反映分子大小、分子中支链数目、整个分子中原子的立体空间结构等,以其作为模型输入参数获得GA-MLR和GA-SVM模型,其R2均在0.75以上,结果比较理想。由ACO获得的特征描述符所建的ACO-SVM模型预测效果令人满意,训练集和测试集的R2均在0.80以上,表明ACO获得的特征描述符与自燃点之间存在较强的非线性关系。此外,GA-SVM和ACO-SVM模型均优于GA-MLR模型,表明分子结构与自燃点之间存在较强的非线性关系。