基于机器学习算法的表面活性剂定量结构-性质关系研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hls123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
定量构效关系(QSAR/QSPR)是用于预测化合物理化性质的数学模型,主要基于计算分子描述符作为参数来建模。QSPR为化工设计提供有效物性参数,预测未知物质的理化性质,对新物质的合成和应用具有指导作用。通过研究表面活性剂三个主要性质:临界胶束浓度(CMC)、克拉夫特点(Krafft)、亲水亲油平衡值(HLB),分别建立离子和非离子表面活性剂表面活性剂数据集并实现QSPR模型。描述符利用前向选择(FS)或主成分分析(PCA)来筛选和降维。算法中除多元线性回归(MLR)外,使用了随机森林回归(RFR)、支持向量机回归(SVR)以及高斯过程回归(GPR)三种机器学习算法,并详细比较了线性和非线性建模过程的具体差异和模型质量。第一部分,分别建立离子和非离子表面活性剂CMC的线性回归与比非线性回归QSPR模型,建立了一个整合阳离子、阴离子和两性离子的CMC预测模型,PCA-GPR(N=333,R2=0.907,Rpred2=0.946)。同时也建立了非离子表面活性剂CMC预测模型,经过对比得出最佳模型PCA-GPR(N=156,R2=0.943,Rpred2=0.937)。第二部分,分别建立了预测离子表面活性剂Krafft点的线性和非线性QSPR模型,讨论了模型的优劣,得到最佳模型PCA-GPR(N=220,R2=0.829,Rpred2=0.901)。第三部分,分别建立了阴离子和非离子表面活性剂HLB的线性模型和非线性QSPR模型,其中阴离子表面活性剂最佳模型为FS-MLR(N=71,R2=0.998,Rpred2=0.997),非离子最佳模型为 PCA-GPR(N=234,R2=0.931,Rpred2=0.955)并将两部分数据集整合后建模,一定程度上提高了模型质量,建立了具有普适性的最佳模型 PCA-GPR(N=305,R2=0.992,Rpred2=0.992)。所有模型都经过留一法交叉验证、外部测试集验证,模型应用域计算,并与以往文献模型对比讨论,充分验证了模型的健壮性、可靠性和优势性。模型不需将表面活性剂细分,可进行较大规模的预测筛选,具有一定的工程意义。利用数据挖掘开源软件KNIME构建了 QSPR自动化流程,整个流程不涉及商业软件,操作方便,移植性、扩展性强,预测性能好,为表面活性剂的分子性能优化设计与工艺应用提供了参考依据。
其他文献
废弃锂离子电池含有大量的金属成分,其回收利用具有较大的经济和社会价值。目前湿法回收废弃锂离子电池主要针对正极材料的浸出和回收,而工业上的锂离子电池废料一般还含有作为集流体的铜箔、铝箔,但集流体也会部分溶解在浸出剂中,将导致浸出液成分复杂,后续分离金属困难。为解决这些问题,本文以钴酸锂-铜-铝为研究对象,以闭环回收钴酸锂为目标,开发了选择性浸出-溶剂萃取-溶胶凝胶法再生钴酸锂的工艺,为绿色高效地回收
学位
煤基费托合成油中的正构烷烃和α-烯烃是重要的化工原料,具有较高的经济价值。因此,煤基费托合成油中正构烃与异构烃、烯烃和烷烃的高效分离十分重要,是实现其高价值利用的有效途径。然而,煤基费托合成油具有组分复杂、馏分宽、碳数分布广等特点,且各组分之间分子结构相近、性质相似,沸点差异较小,因此通过常规萃取精馏技术来分离费托合成油存在着能耗较高,且难以分离沸点极相近的组分的缺点。本文对α-烯烃与烷烃的分离、
学位
金属有机骨架材料(MOFs)是一种重要的多孔晶体材料,具有高孔隙率、低密度、大比表面积、孔道规则、孔径可调、拓扑结构多样性和可裁剪性等优点,因此在吸附(液相和气相)、分离、纯化、催化、药物传递、结构修饰以及化学传感等方面具有良好的应用前景。混合金属有机框架材料(mm-MOFs)是MOF材料中的一个子类,通常含有两种或多种在结构中分布均匀的金属节点。与单金属MOF相比,含有混合金属SBU的双金属MO
学位
以吡啶及喹啉N-氧化物为代表的杂环N-氧化物常被用作氧化剂、助剂、保护基团以及金属配合物中的配体等,应用广泛,发展前景广阔。目前,以过氧硫酸、过氧乙酸、双环氧乙烷等为氧化剂的非催化氧化法是杂环N-氧化物的传统制备方法,但是该方法存在设备腐蚀、环境污染等问题。因而,从绿色化学的角度出发,开发以廉价、绿色的H2O2为氧化剂的非均相催化氧化法具有重要的意义。首先,采用不同的方法制备了样品1、样品2、样品
学位
聚苯醚(PPO)具有优异的低介电性、耐热性和尺寸稳定性等综合性能,并可沿用传统环氧树脂基覆铜板的成型工艺及设备,在高速高频电子器件领域应用潜力巨大。但是,由于商业的PPO分子量高,反应性基团少,难以自固化或与其它树脂复合固化,致使PPO的性能优势在覆铜板领域不能被充分发挥。论文以开发高速高频覆铜板用改性PPO为主要目标,基于再分配反应和端基修饰反应技术,通过分子结构设计和反应条件优化,合成了双端羟
学位
当前全球糖尿病患者已超过4.25亿,血糖检测的全球市场容量高达200多亿美元。在酶电极法检测血糖的原料酶中,FAD葡萄糖脱氢酶(FAD-GDH),能够避免麦芽糖和氧分压对葡萄糖测定的干扰,在当下及未来血糖检测领域有着较大的价值,研究制备FAD-GDH的生产工艺具有重要意义。天然来源的菌发酵FAD-GDH,存在表达水平低、发酵液成分复杂难于纯化等问题。已报道的FAD-GDH重组表达,停留在摇瓶和小规
学位
碳中和目标的达成是我国未来三十年的重大挑战,加强生物质资源利用是实现碳中和的重要途径。糠醛作为典型的生物质平台化合物之一,主要由木质纤维素类生物质降解所得,不仅可直接用作工业溶剂,也可用于生产树脂、胶粘剂、清漆、农药、橡胶和防腐蚀涂料等产品,应用十分广泛。通过一系列催化转化的手段,糠醛可以生产糠醇或长链烷烃等高附加值下游化学品。目前,糠醛的加氢等反应普遍采用金属负载催化剂,在其转化为糠醇和辛烷的过
学位
树状大分子是一类具有树枝状拓扑结构的高分子。与传统的线性高分子不同,树状大分子具有单一的分子量、精准的分子结构、大量可功能化的表面基团以及可通过主客体相互作用负载药物的内部疏水空腔等特点。这些特点为树状大分子成为一类良好的药物载体提供了优越的条件。但是,当前的树状大分子内部结构单一,载体与药物分子间的相互作用较弱,无法实现对药物分子的高效包载,大大阻碍了其作为纳米药物载体的临床应用。为了解决树状大
学位
论文研究了富氨基磁性纳米颗粒的制备及应用于离子染料的吸附。通过改进的共沉淀法制备油酸表面修饰的磁性纳米颗粒(MNPs),利用4-乙烯基苯胺的两亲性在水中极性调控自组装,引发原位聚合后得到富氨基MNPs,并研究pH值改变对自组装体系构筑的影响。制备出的核壳结构富氨基MNPs用于染料曙红Y、甲基橙和亚甲基蓝的吸附研究,并以曙红Y为例,进行吸附等温线和吸附动力学研究。首先采用改进的共沉淀法,一步制得油酸
学位
水凝胶具有质地柔软、利于营养物质交换、可保持创面湿润以及较好的生物相容性和可生物降解等优点,是一种理想的伤口敷料。负载活性药物的水凝胶敷料能够通过药物的控制释放防止细菌感染、消除炎症,从而有效促进伤口愈合。水凝胶的组成、结构、形貌、药物分布等性质是影响其性能的关键因素。超临界溶液浸渍技术(Supercritical solution impregnation,SSI)具有温度条件温和且不使用有机溶
学位