基于文本挖掘的ZSM-5分子筛合成数据提取

来源 :吉林大学 | 被引量 : 0次 | 上传用户:pppxulan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
沸石分子筛是一类具有规则纳米孔道的硅铝酸盐晶体,作为催化、吸附分离和离子交换材料已被广泛应用于能源、环境等重要领域。一部分沸石晶体可天然形成,其他大部分沸石晶体是人工合成的。其中,具有重要工业应用的ZSM-5分子筛是由Mobile公司于1972年发现的,已被广泛用于炼油工业、精细化工和环境保护等重要领域。沸石分子筛的合成受很多因素的影响,如反应物组成、反应原料的类型和性质、晶化温度、晶化时间、p H等。分子筛合成体系的复杂性,导致分子筛的合成与晶化机理尚未明确。长期以来,新型分子筛的研发往往采用传统的手工“试错法”,具有极高的盲目性和偶然性。建立先进的分子筛合成信息数据库,对加速以功能为导向的新型分子筛材料的研发至关重要。数据库技术是近年来在材料化学等领域得到快速发展的信息学技术,通过对已知数据的整理分析,挖掘合成规律与构效关系,能够促进相关领域新材料的研发。目前,分子筛领域尚无真正意义上的合成信息数据库。针对这一问题,本论文以ZSM-5分子筛合成体系为研究对象,开发了基于文本挖掘的数据库搭建技术,结合规则匹配与自然语言处理技术,自动提取已公开发表的文献中的合成数据,构建ZSM-5分子筛合成信息数据库。在此基础上,利用数据挖掘技术,研究ZSM-5分子筛的合成规律,为后续的实验研究提供理论指导。本论文的第一部分工作是数据提取。我们建立了包含1764条ZSM-5分子筛合成信息的数据库和包含211条数据的反应原料语料库。首先,我们检索了分子筛的合成文献,手动提取了3175个合成段落,对其进行预处理和标签化处理。然后,采用规则匹配和自然语言处理相结合的文本挖掘方法自动进行化学信息提取,利用自定义词典加以辅助,通过4个提取评价标准评估提取结果和优化提取模型。最后,经过信息填充、人工验证等步骤,建立了分子筛合成数据库。本论文的第二部分工作是数据挖掘。我们探究了ZSM-5分子筛合成参数范围及相关性、晶化范围和合成条件对产物Si/Al比的影响。通过决策树分类模型,发现反应物料的Si/Al比、Na/Si比、H2O/Si比以及TPAOH/Si比对产物的Si/Al比具有重要的影响。本论文提出利用规则匹配和自定义自然语言处理技术相结合的文本挖掘方法,快速精准提取合成信息并自动搭建数据库,实现了将数量繁多且杂乱无章的ZSM-5分子筛合成信息以严格的数据格式统一化集中管理。该数据库不但可以进行信息检索,而且可以实现合成信息的数据共享,能够帮助科研人员快速高效获取分子筛的合成信息,还可以作为分子筛机器学习的原始输入数据。利用数据挖掘技术探究不同因素对分子筛合成的影响,建立合成条件和产物Si/Al比之间的联系,总结出ZSM-5分子筛的合成规律,为实验定向合成具有特定Si/Al比ZSM-5分子筛提供理论指导。
其他文献
背景随着城镇化进程的加快,我国城市建成密度越来越高,人口的剧增使得城市交通承载超负荷,传统的地面二维交通模式已经不能适应城市飞速发展,因此建设城市立体交通已成为缓解交通拥堵问题的有效途径之一1。与此同时,城市公共空间尤为稀缺,逐步扩大的桥下空间如何进行高效、科学地利用已经成为城市更新发展中重要的一部分2。2021年2月5日北京发布的《关于“十四五”时期深化推进“疏解整治促提升”专项行动的实施
期刊
介绍了洞石材料的特性及使用标准,以武汉蓝光雍锦香榭售楼部洞石外立面幕墙应用为例,从选样定样、深化加工、运输存放等方面,总结分析了洞石在建筑幕墙上的全过程设计管控注意事项,以达到石材幕墙施工规范要求。
[db:内容简介]
法学的科学性存在两种标准:一是亚里士多德意义上的科学性标准;二是近代以来自然科学所确立的科学性标准。二者分别代表着演绎科学和归纳科学两种不同的科学性立场。在第一个标准之下,法学通过对法律规范文本的作业,着力概念体系和规范体系的理论建构,将逻辑演绎发挥到了极致。与此同时,一方面,法律论题学、修辞学等通过问题思维消解了法学逻辑演绎的体系思维极端化弊端;另一方面,藉由法律诠释学方法,通过理解的前理解结构
[db:内容简介]
[db:内容简介]
[db:内容简介]
阪崎肠杆菌(Enterobacter sakazaii)是肠杆菌属的一种条件致病菌。近年来,对食品加工厂原料、生产环境及家庭中阪崎肠杆菌污染状况的研究发现,阪崎肠杆菌在自然界中分布广泛[1]。1980年,Farmer等人在进行肠杆菌基因杂交研究时发现,阴沟肠杆菌与阪崎肠杆菌的基因杂交后,其色素与生化反应均有较大差别,因此将其从阴沟肠杆菌的菌属中分离出来,命名为阪崎肠杆菌[2]。1961年,U
期刊