论文部分内容阅读
沸石分子筛是一类具有规则纳米孔道的硅铝酸盐晶体,作为催化、吸附分离和离子交换材料已被广泛应用于能源、环境等重要领域。一部分沸石晶体可天然形成,其他大部分沸石晶体是人工合成的。其中,具有重要工业应用的ZSM-5分子筛是由Mobile公司于1972年发现的,已被广泛用于炼油工业、精细化工和环境保护等重要领域。沸石分子筛的合成受很多因素的影响,如反应物组成、反应原料的类型和性质、晶化温度、晶化时间、p H等。分子筛合成体系的复杂性,导致分子筛的合成与晶化机理尚未明确。长期以来,新型分子筛的研发往往采用传统的手工“试错法”,具有极高的盲目性和偶然性。建立先进的分子筛合成信息数据库,对加速以功能为导向的新型分子筛材料的研发至关重要。数据库技术是近年来在材料化学等领域得到快速发展的信息学技术,通过对已知数据的整理分析,挖掘合成规律与构效关系,能够促进相关领域新材料的研发。目前,分子筛领域尚无真正意义上的合成信息数据库。针对这一问题,本论文以ZSM-5分子筛合成体系为研究对象,开发了基于文本挖掘的数据库搭建技术,结合规则匹配与自然语言处理技术,自动提取已公开发表的文献中的合成数据,构建ZSM-5分子筛合成信息数据库。在此基础上,利用数据挖掘技术,研究ZSM-5分子筛的合成规律,为后续的实验研究提供理论指导。本论文的第一部分工作是数据提取。我们建立了包含1764条ZSM-5分子筛合成信息的数据库和包含211条数据的反应原料语料库。首先,我们检索了分子筛的合成文献,手动提取了3175个合成段落,对其进行预处理和标签化处理。然后,采用规则匹配和自然语言处理相结合的文本挖掘方法自动进行化学信息提取,利用自定义词典加以辅助,通过4个提取评价标准评估提取结果和优化提取模型。最后,经过信息填充、人工验证等步骤,建立了分子筛合成数据库。本论文的第二部分工作是数据挖掘。我们探究了ZSM-5分子筛合成参数范围及相关性、晶化范围和合成条件对产物Si/Al比的影响。通过决策树分类模型,发现反应物料的Si/Al比、Na/Si比、H2O/Si比以及TPAOH/Si比对产物的Si/Al比具有重要的影响。本论文提出利用规则匹配和自定义自然语言处理技术相结合的文本挖掘方法,快速精准提取合成信息并自动搭建数据库,实现了将数量繁多且杂乱无章的ZSM-5分子筛合成信息以严格的数据格式统一化集中管理。该数据库不但可以进行信息检索,而且可以实现合成信息的数据共享,能够帮助科研人员快速高效获取分子筛的合成信息,还可以作为分子筛机器学习的原始输入数据。利用数据挖掘技术探究不同因素对分子筛合成的影响,建立合成条件和产物Si/Al比之间的联系,总结出ZSM-5分子筛的合成规律,为实验定向合成具有特定Si/Al比ZSM-5分子筛提供理论指导。