材料高通量计算与机器学习一体化平台设计与实现

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:kxlzyc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在材料领域,以材料数据挖掘、高通量计算筛选、计算材料模拟设计和人工智能为核心的虚拟材料设计技术,已经广泛应用在新材料设计、制备合成工艺调控等研发中,其效果远超人们所想。虽然我国提出材料基因工程计划,加快材料发展进程,但在数字化方面还落后于发达国家。因此,在推进我国材料信息化建设过程中,如何构建合理的材料数据库,如何通过高通量计算实现数据的快速累积,如何使用合适的机器学习算法,以便更好的帮助材料工作者成为当前亟需解决的问题。本文主要是通过搭建高通量与机器学习一体化平台,通过材料数据库中的数据进行高通量计算,实现数据扩充与累积,并在此基础上结合机器学习算法进行数据挖掘与实验模拟,具体内容如下:(1)设计和搭建高通量计算部分:可视化的供用户选择一个或多个需要计算的材料物质,在数据库中提取有效的计算数据,自动化生成高通量输入文件,生成多个输入文件包,并行提交到计算队列中运行。这极大的改善了传统手动构建输入文件包,手动提交的低效率情况,并且对于输出文件包也进行了处理,可视化地展示运行状态,便捷地对高通量计算结果解析,将计算之后的材料数据回存至数据库。该部分首先加快了数据库中的数据累积过程,从而为后面的机器学习与数据挖掘提供数据基础。其次数据库方面也是高通量计算的基础部分,它通过网络爬虫技术进行初始数据获取,对材料数据整体分析。本文参考了当前流行的材料平台Material Project的数据库,采用MongoDB数据库进行数据的存储整合。(2)设计机器学习模块:将现有流行的机器学习算法与材料数据进行结合,并将机器学习代码中关键参数与前端界面结合,让用户可以方便地进行可视化机器学习。同时针对材料数据量稀疏的问题,设计了材料数据自动扩充功能。根据相关实验结果显示,传统机器学习算法更适合稀疏数据量的材料数据,所以本文的平台加入了以支持向量机、决策树和随机森林等算法为基础并进行部分改进的方法,可以更好的帮助材料工作者的工作。通过反复测试,本文设计的材料高通量计算与机器学习一体化平台的功能完善,高通量计算功能能够切实帮助材料工作者快速大量的进行材料计算,机器学习功能能够帮助使用者进行数据挖掘工作,并且元素数据扩充功能可以有效的提高训练的准确性。平台已在中国科学院上海硅酸盐研究所服务器上成功部署,并为所内学生的一篇论文提供数据支持。
其他文献
随着计算科学的不断进步,机器学习在凝聚态物理领域的应用越加广泛。机器学习,即machine learning(ML),是一门机器对经验利用的学科。机器学习与人类学习相似,人类学习是通过对已知的事物进行学习,当接触新事物时,便可以通过所学习的知识进行判断和分析;机器学习则是机器对输入样本进行学习进而产生一个“黑盒子”,当新的样本输入到“黑盒子”中,机器可以根据已生成的“黑盒子”做出判断。机器的学习能
城区老旧办公楼普遍存在停车难问题,目前解决方案主要有:对院内空地、绿化用地重新调整,新增地面停车位或机械车库;对现有地下停车位进行改造,将层高满足要求的车位改造成立体机械车位;对现有机械车库进行改造,建设大容量立体机械车库。根据各省市公司办公大院的实际情况,多建设有立体机械停车库,同时考虑规划容积率、建筑密度、控制高度、绿化率指标的限制,对原老旧立体停车库进行技术改造建设大容量立体机械车库是
会议
从弹道导弹防御拦截武器、预警探测、指挥控制与先进防御技术等方面对国外弹道导弹防御发展态势进行了跟踪研究。通过分析可以看出,国外弹道导弹防御发展总体格局保持不变,装备与技术发展呈现快速发展态势。美国调整了导弹防御发展战略,谋求在能力和规模上取得竞争优势,并继续引领导弹防御装备与技术发展,俄罗斯、以色列、日本和印度等国正在加速发展导弹防御拦截武器和预警探测系统,弹道导弹防御整体作战能力不断提升。
随着新课程改革的不断深入,教师的教学理念和教学方式都发生了改变,"将课堂还给学生,让学生成为学习的主人"越来越受到教师的重视。在小学数学教学中要想充分发挥学生的主体作用,教师需要转变观念,处理好"主导"与"主体"的关系;在教学中创设生活化的教学情境,唤起学生的主体意识;开展小组合作探究学习,突出学生的主体地位;提供动手实践的机会,激发学生的主观能动性。
小学生在学习数学知识的过程中,出现错误是在所难免的。然而作为授业解惑的指导者,教师还需要对学生出错的原因进行科学的分析,并积极寻求策略改进,以便能够达到知识强化和巩固的效果。基于此,本文从数学基础知识不够扎实、阅读理解能力不够透彻和教师缺乏重视三方面,分析了学生错题的原因。在此基础上,提出强化学生数学基础、提高学生阅读能力和加强对数学练习题的重视三个有效策略,希望能够给小学数学同行一些借鉴,帮助其
切实做好以习近平新时代中国特色社会主义思想为指引的理论学习是党(总)支部需要全力推动的政治任务,本文围绕以直播形式探索学习型党(总)支部建设为主题,探讨在此创新探索过程中需要关注的现实问题,并从直播内容的专业化构建、建立同直播新形式相适应的管理制度、增强理论学习把握实践中的规律性认识三个主要方面开展实践探索。
在过去的二十年中,超材料的理论、设计和工程应用受到了学术界和工业界极大的关注,并取得了可观的成果。目前,成熟有效的超材料设计方法,主要依托于计算电磁学和高性能计算(High Performance Computing,HPC)的快速发展,借助如CST、HFSS、COMSOL等仿真软件对麦克斯韦方程组进行直接数值求解。随着超材料结构、工艺和功能复杂度的不断提升,为了达到超材料在振幅、带宽等方面的性能
通过对典型煤矿区的河流表层沉积物进行调查与采样分析,探讨不同类型河流沉积物重金属质量比的变化及对水生态环境的影响。结果表明,受矸石堆场排水、矿井排水和洗煤排水的影响,煤矿区污染河流的沉积物可分为砂质沉积物、黄色泥质沉积物和黑色泥质沉积物。黄色泥质沉积物中Fe、Cd、Hg的平均质量比分别是黑色泥质沉积物的4.46倍、2.19倍、1.59倍,是砂质沉积物的2.36倍、2.43倍、1.59倍;而黄色泥质
新课改背景下,小学数学教学不应仅局限于学生数学基础知识的习得、基本运算方法的掌握,而应当注重学生的数学思维和具体问题具体分析与灵活解决的能力培养,从而使学生在学习过程中领会数学思想,提升数学思维,学会用数学思维方法去解决问题。本文就小学数学学习中常用的数形结合思想如何渗透于小学数学教学中的问题进行探讨,以期提高小学生的数学思维和素养。
在材料的发现中,探索材料的结构、组分和性能的关系是非常关键的,机器学习可以作为一种有效的工具。然而,传统机器学习的复杂性和模型可解释性的缺乏,使得很难推导出简单的描述性公式。钙钛矿材料因其在燃料电池和电催化方面具有很多出色的性能而受到许多研究学家的关注。热力学稳定性是一个关键参数,它广泛地决定了材料是否有望合成,以及在一定的操作条件下是否会分解。热稳定性和化学稳定性,在很大程度上取决于材料的形成能