论文部分内容阅读
铝电解生产过程中的阳极效应将导致能耗增加、电流效率降低,进而导致生产效率下降。因此,及时有效地预测阳极效应有助于避免以上问题的发生。在实际生产中,由于诸多问题,导致有标签数据量不足,极大地限制了传统数据驱动的阳极效应预测方法的性能。最近,迁移学习理论利用源域充足的有标签数据帮助缺乏标签数据的目标域构建可靠的模型,为解决上述难题提供有效的手段。因此,本文以中国两个铝电解厂实际生产数据为研究对象,针对目标域少量有标签数据难以训练可靠的阳极效应预测模型的问题,利用迁移学习理论方法,分别从铝电解低质量数据预处理、源域样本筛选与迁移、铝电解数据分类三方面,系统地开展阳极效应预测研究。本文主要工作如下:
首先,为降低测量过程中的误差,本文对原始铝电解数据使用K-Means算法去除异常值,再利用随机森林算法填补缺失值,并用最小最大值标准化法消除不同特征量纲的差异,为后续迁移工作提供真实数据支撑;在此基础上,为解决源域数据集中与目标域数据集无关的样本容易产生负迁移的问题,开展了基于K-Means算法的源域样本筛选研究,通过分析源域和目标域的分布情况,以剔除与目标域无关的源域样本,并通过改进TrAdaboost算法进行实例迁移;最后,为解决现有阳极效应模型中超参数寻优效率低下的问题,研究并设计了一种基于贝叶斯优化(Bayesian Optimization, BO )与轻量级梯度提升决策树(Light gradient boosting machine, LightGBM)算法的阳极效应预测模型,减小搜索范围,并极大提高最优超参数搜索效率。
本文通过实验分析对提出方法进行有效性验证,结果表明在提前10分钟的情况下,阳极效应预测的F1分数能达到89.6%,比仅使用目标域样本训练提升了6.3%,实现了小样本条件下阳极效应的有效预测。
首先,为降低测量过程中的误差,本文对原始铝电解数据使用K-Means算法去除异常值,再利用随机森林算法填补缺失值,并用最小最大值标准化法消除不同特征量纲的差异,为后续迁移工作提供真实数据支撑;在此基础上,为解决源域数据集中与目标域数据集无关的样本容易产生负迁移的问题,开展了基于K-Means算法的源域样本筛选研究,通过分析源域和目标域的分布情况,以剔除与目标域无关的源域样本,并通过改进TrAdaboost算法进行实例迁移;最后,为解决现有阳极效应模型中超参数寻优效率低下的问题,研究并设计了一种基于贝叶斯优化(Bayesian Optimization, BO )与轻量级梯度提升决策树(Light gradient boosting machine, LightGBM)算法的阳极效应预测模型,减小搜索范围,并极大提高最优超参数搜索效率。
本文通过实验分析对提出方法进行有效性验证,结果表明在提前10分钟的情况下,阳极效应预测的F1分数能达到89.6%,比仅使用目标域样本训练提升了6.3%,实现了小样本条件下阳极效应的有效预测。