材料数据挖掘与机器学习工具的集成与优化

来源 :数据与计算发展前沿 | 被引量 : 0次 | 上传用户:gqkhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]针对材料科学工作者开展机器学习工作门槛较高这一现状,本文基于MatCloud研发一个用户友好、自动化的材料数据挖掘与机器学习模块Auto-Mat.[方法]本文对MatMiner和scikit-learn中一些已有的获取数据的方法和机器学习算法进行了集成,并定义了数据字典以读取不同材料计算数据库的数据.同时,自主研发了一些特征筛选和处理方面的算法.[结果]能够提供一个具有可视化交互和展示界面的材料数据挖掘与机器学习模块,并将数据以统一的格式呈现.同时,自主研发的算法,对模型的性能均有一定提升.[局限]对于数据的获取,目前仅仅能获取到通过MatMiner API中的数据,相关代码的编写也完全和MatMiner API保持同步,因此可扩展性较差.而且,目前一些核心算法的执行速度有待提升.[结论]通过该模块与MatCloud的集成,用户可以“一站式”地读取Materials Project等几个主流数据库中的数据,并快速构建属于自己的材料数据挖掘与机器学习工作流程.并在最后通过2个案例的对比分析,说明了该模块对于降低用户开展材料数据挖掘与机器学习的使用门槛有着积极作用.
其他文献
围绕石英前剂量110℃峰TL信号的测量,进行了石英样品处理、仪器测量参数优化,并研究了石英样品110℃峰TL响应与石英粒度、激活温度和激活时间的关系,建立了石英前剂量TL测量
研究了使用图形处理器(GPU)对调强放射治疗计划系统(IMRT)中分子动力学优化方法的加速方法及效果。利用统一计算设备构架(CUDA)平台,分别对4个临床肿瘤调强病例的笔束剂量响
建立了用碳稳定同位素比估算大气颗粒物中多环芳烃(PAHs)的方法,该方法包括二氯甲烷提取、薄层色谱纯化和气相色谱-燃烧系统-同位素质谱测定碳稳定同位素组成(δ 13C);并用该
[目的]对边缘智能技术进行系统而全面的介绍,为相关读者了解和关注边缘智能提供一定的参考,并启发更多的学者开展物联网时代边缘智能模型的研究.[方法]本文首先简要介绍了边
[目的]SDN交换机南向协议性能测试系统致力于通过构造测试场景,按照一定的流量策略探测被测交换机各项性能指标,评价其是否满足用户性能需求.[文献范围]本文重点调研了SDN交
[目的]通过对网络切片管理系统以及运营商行业实践的分析,为运营商5G独立组网(Standalone,SA)试商用阶段网络切片业务发展提供有效参考与样板.[文献范围]文章参考国际标准中
[目的]现有的云服务计算模型无法满足数据驱动型科研范式的发展.如何设计并实现符合数据密集型科学计算处理的架构是当前研究的一个热点方向.[文献范围]文章重点分析了数据驱
【目的】伴随5G和人工智能(Artificial Intelligence,AI)技术的飞速发展,各类型的应用不断涌现,不同应用对计算和网络都有着特定要求。为了给用户提供更好的体验,需要为不同应用提供满足需求的计算资源和确定性的网络资源,因此计算资源与网络资源的联合优化成为一个重要的研究领域。【文献范围】文章重点调研了计算资源与网络资源联合优化的解决方案,以及相关案例在现网中的应用等。【方法】本文
[目的]对3GPP中的5G网络音视频传输相关标准进行介绍,为相关运营商和服务提供商利用5G进行网络音视频传输提供参考.[方法]通过对3GPP标准进行研究,梳理介绍了基于5G系统的流
[目的]介绍了算力网络面向业务需求,在云、网、边之间按需分配和灵活调度计算资源的网络组织方式.该方式旨在实现更广泛的计算资源的统一调度和纳管.而在网络边缘侧,由于各种