论文部分内容阅读
随着计算机在铝电解生产行业中应用的推广,各厂在生产过程中均采用了计算机参与的监控系统实现对电解槽的自动化控制。各种槽况数据被监控系统自动采集,在铝电解生产行业积累了大量的历史数据。然而现有的系统数据共享度、集成度低、且只能进行简单的数据录入、查询、统计等事务性的处理过程,却不能发现这些海量的数据中蕴含的对企业生产和管理具有重要的指导作用的规则和规律。决策者迫切需要从海量数据中提取有价值的信息和知识,以用于电解槽的管理,提高生产效益。焙烧启动是影响铝电解槽寿命进而影响企业经济效益极为重要的因素之一,所以对焙烧启动期间电解槽的状况分析相当重要。 本文主要对数据仓库和数据挖掘技术在铝电解领域中的应用作了研究和开发;介绍了数据仓库数据挖掘的基本概念,对铝电解焙烧启动的数据仓库进行了设计,并开发了抽取、转换、装载ETL(Extract Transform Load)工具,实现了多种预处理方法,完成了数据仓库的建设。 着重对数据挖掘中的聚类、分类、关联规则算法进行了研究和针对铝电解数据特点的改进,使其能产生更有效和实用的挖掘结果。包括:1、聚类中的k-means算法,改进和简化了基于单亲遗传的k-means算法,消除传统的k-means对初始中心点的依赖性;2、分类中的ID3算法,针对铝电解数据全是连续型数值,而ID3只能处理离散数据,提出一种改进的动态划分数据区间的数值型ID3算法,使其能建立更优的决策树、数据的处理结果更符合生产管理需求;3、基于FP-Growth的关联规则算法,根据铝电解数据的分布特点改进了该算法,使其可以对连续型的铝电解数据的直接分析处理,自动获取不同区间数据之间的关联关系,使挖掘出的规律对生产更有指导价值。 设计和开发了铝电解数据挖掘系统,并利用实现的改进算法对电解槽焙烧启动期间的槽状态数据进行了聚类、分类和关联分析,发现了异常槽及得出了槽况的分类规则;分析各工艺参数之间的相互影响关系,及确定较高电流效率的最佳的工艺参数组合,同时也证明了本文改进算法的有效性和实用性。 该系统应用于铝电解生产行业的数据处理中,能够有效指导电解槽的稳定生产、延长槽寿命、提高生产效率,为科学化管理提供依据。