【摘 要】
:
温室气体减排成为时代主题之一,对二氧化碳的化学利用迫在眉睫。将二氧化碳作为碳一合成子,通过C-H键的羰基化反应实现一系列有价值的杂环化合物是二氧化碳利用领域中的重要研究方向;另一方面,传统的有机合成的开发需要大量的实验去验证,耗时耗力,而且可能存在危险性等问题,而通过机器学习模型可以从过去积累的数据中挖掘出规律、预测其趋势,不仅省时省力,还能有效降低对化学专业知识人才的依赖。本论文针对化学实验室积
论文部分内容阅读
温室气体减排成为时代主题之一,对二氧化碳的化学利用迫在眉睫。将二氧化碳作为碳一合成子,通过C-H键的羰基化反应实现一系列有价值的杂环化合物是二氧化碳利用领域中的重要研究方向;另一方面,传统的有机合成的开发需要大量的实验去验证,耗时耗力,而且可能存在危险性等问题,而通过机器学习模型可以从过去积累的数据中挖掘出规律、预测其趋势,不仅省时省力,还能有效降低对化学专业知识人才的依赖。本论文针对化学实验室积累的一系列二氧化碳作为羰基源参与的杂环化合物的合成的研究,通过探索一套建模框架,以机器学习方法挖掘反应规律建立相关反应收率预测体系,并以之辅助材料的合成。具体有以下两方面的内容。一、机器学习应用于二氧化碳作为羰基源参与的杂环化合物的合成产率的预测。本部分主要对产率预测进行探索(回归和分类模型),同时对多种模型之间进行比较,对模型超参数进行优化。此外针对1.杂环类化合物合成的反应信息的采集和对特征的提取目前还没有成熟的方法;2.该类反应的样本量较小,不利于对模型的构建等问题,本研究也做了相关的处理,如所使用的数据集既有来自发表文献的公开报道,又有来自实验记录的相应的试验,以补充数据集的分布,特别是低产率的反应。最终研究收集192个反应样本,并基于分子描述符、Rdkit工具包来提取分子特征,共计1837维和由独热编码计算特征2048维。另外相较于传统仅对训练集和测试集进行一次随机划分,本研究对所有建模预测所用样本皆进行随机100次划分,通过预测指标的平均值来衡量模型结果。结果显示,产率预测回归模型的决定系数R~2最大值为0.43。在两类预测模型中,支持向量机模型都表现出了对该数据集的最好的适用性,而随机森林模型的表现次之。二、在建立预测模型后,设计了一类发光材料分子,并通过预测模型预测了反应的收率的同时,也在实验中对预测结果进行了对比,同时也对合成的材料分子进行了光学性能的表征(包括结构表征、吸收光谱、发射光谱等),从吸收发射结果来看,该分子有一定的光学性能,有可能在未来的发光器件中得到应用。通过本研究发现,反应机制有所差异的有机合成反应类型中,以上述反应来提取数据特征的方式建立n维化学反应空间,用适合的算法模型依然能够较好地挖掘该类反应产率的定性关系,为以后对有机合成产率预测模型的构建和训练打下了良好的基础。
其他文献
乳腺癌的高发性已成为女性癌症中的主要杀手。手术切除依然是治疗乳腺癌的主要手段。这不仅会增加患者的痛苦,同时也会给患者造成极大的心理创伤。随着乳腺癌发病率的增加,切除后的乳房迫切需要修复,且寸尺的精准度也是一个挑战。这就需要不仅有较好的生物材料,且精准化个性定制才能满足上述的要求。3D打印技术包括计算机辅助设计,采用生物墨水精确调控,选择生物相容性较好的水凝胶,才能促进组织的再生,加速伤口的愈合。本
近年来,随着抗生素的大量使用和废水的随意排放,导致水体环境安全越来越严峻。半导体光催化技术可利用太阳光将有机污染物降解,因绿色环保、能耗低、高效而备受关注。三氧化钨(WO3)禁带宽度适中、能在可见光响应并在酸性和氧化条件下稳定存在,被广泛应用于光催化研究领域。然而,单一WO3的光生电子-空穴对复合几率高,极大限制了WO3的实际应用。因此,围绕WO3材料通过与其他半导体材料复合构建异质结以提高其光催
氢气作为一种清洁的可再生能源,具有燃烧值高,燃烧对环境无影响的优势。它是一种有前途的能源,可替代化石燃料。通过将氢能源与燃料电池技术有机结合,可以显著减少交通运输行业对石油和天然气的消耗,从而极大地提升能源安全水平。然而,氢能利用的最大瓶颈是其安全储存和快速释放。从储氢的角度讲,氨是较为理想的储氢材料,不仅分子含氢量高,且易液化易运输;更为重要的是,氨分解制氢是一个没有碳氧化物排放的过程。到目前为
高性能压电材料具有高机电耦合系数、高压电系数、高介电常数等优异性能,为宽带、高分辨率、高灵敏度医学超声成像和水声探测及高功率密度压电能量收集器等器件研发带来了希望。铌镁酸铅-钛酸铅(Pb(Mg1/3Nb2/3)O3-Pb Ti O3,以下简称PMN-PT)二元系陶瓷是近年来快速发展的一种弛豫铁电材料,具有高介电、高压电、低烧结温度等特点,在微位移驱动器、超声换能器、加速度传感器等方面有广阔的应用前
高熵合金因其能够形成简单的相结构而具备高硬度、高强度和耐腐蚀性等优异性能,有着良好的应用前景。多主元设计的高熵合金,虽然提高了材料的成分空间,但也对材料的优化设计增加了难度。目前,传统试错法和一些计算方法,如相图计算、密度泛函理论、分子动力学等对于指导高熵合金成分设计和发现优异性能往往存在成本高、花费时间长的弊端,所以,需要研究出一种新的手段以加速研究高熵合金的组分空间。近几年,随着对高熵合金的深
氮不仅是生物生命体中主要营养成分,也是植物中叶绿素的重要组成部分。我国的化肥年产量一千万吨,约占全球的35%,除了部分氮肥被植物吸收以外,其余化肥的“径流”成为了亚硝酸盐危害的重要根源。此外,由于城镇化和工业化的快速发展,生活垃圾和工业废水的大量排放也导致了亚硝酸盐和硝酸盐广泛存在于土壤和地下水中,是土壤硝酸盐累积以及海洋水体富营养化的主要原因之一。与此同时,饮水和食品中的亚硝酸盐对人体生命健康存
煤炭资源作为我国一次能源中占比最大的消费来源,其地位仍将难以代替。煤炭开采中的煤尘防治一直以来都是影响矿井安全开采的重要难题,也是实现绿色安全开采的关键。对于疏水性烟煤而言,传统物理抑尘方法效果较差,难以满足矿井对煤尘抑制的要求。研究发现表面活性剂可以有效润湿煤尘表面,从而起到一定的抑尘效果。因此,近年来,化学抑尘方法因其可以显著提升煤尘防控效果成为煤尘治理研究的热点方法之一,其抑尘机理和技术也引
随着移动电子设备的快速发展,小型化、便携化成为未来的发展趋势。因此,不需要更换储能装置也能为其不断持续的供应电能是相关研究的重点。在目前已研究制备的各种能量收集转化装置中,摩擦电纳米发电机(TENG)以其输出功率高效、组装材料选择宽泛、制造工艺绿色环保和成本较低而备受关注。最近有许多研究通过不同的掺杂改性的方法成功的提高材料的表面电荷密度,进而显著提高了输出性能,实现了TENG相关领域的应用。例如
制备具有优异强度和延展性组合的高性能工程合金一直是材料科学家的目标。由于具有超高的比强度,钛合金可以达到一个优异的强度与延展性组合。本文首先通过精细的热处理工艺在α+β钛合金中制备出了具有均质双态结构以及晶粒尺寸为15μm的等轴β晶粒的Ti-5553钛合金。随后,系统地研究了不同热处理工艺对Ti-5553钛合金的微观组织演变。为了研究Ti-5553钛合金的微观组织对力学性能的影响,对不同热处理处理
锂离子电池的高成本和高反应活性限制了其在大规模储能应用中的发展。因此,有必要寻求替代电池,其中可充电水性锌离子电池(ZIB),由于其环境友好性、价格低廉和安全性高,吸引了许多研究人员的目光。并且以水系电解液代替传统有机电解液的电池体系有望进一步降低电池的生产成本,同时提高安全性。到目前为止,研究人员已经发现了许多适合ZIB正极的材料,如锰基材料、钒基材料、普鲁士蓝类似物等。Mn O2由于来源丰富、