论文部分内容阅读
随着能源清洁化、电网智能化和交通电气化的不断推进,电池以其模块化结构、多电化学体系和任意电压适配的优势,开始从小规模单系统应用发展到大范围、规模化部署阶段,从单个电池系统独立运行发展到通过网络连接大规模协同运行的阶段。传统的电池管理方法多基于机理模型和实验室数据,已不能应对电池大规模应用所面临的复杂工况、强不一致性、高安全要求和海量数据等情况,本文针对电池大规模应用提出电池群组概念,基于数据挖掘理论,开展电池群组数据分析体系的研究,主要有以下几个方面:(1)针对电池系统在复杂工况环境下,产生的低完整度、高噪声的缺陷数据,首先分析缺陷数据类型,从统计理论和数据挖掘理论两个方面研究缺陷数据修复方法,再基于聚类分析提出一种基于邻近性的潜在噪声数据划分方法用于识别潜在噪声并进行缺失化处理,最后基于回归分析建立多元线性回归模型对缺失数据进行重新填充,提高了复杂现场环境条件下的数据质量,降低了电池管理算法模型的过拟合风险。(2)针对电池系统运行产生的高时变、高维、非线性、不等维数据空间,提出了时间序列和伪循环周期序列两种电池数据划分方法,并分别基于形状注意力机制建立了时间序列特征提取算法和基于主成分分析-堆叠自编码器融合网络建立了伪循环周期序列特征提取算法,提高了复杂现场环境下使用低维空间数据对电池关键特征的高精度表达能力。(3)针对电池大规模部署产生的高多样性、小样本数据特点,结合集成学习理论,提出了一种基于聚类的样本多样性增强和基于降维扰动的属性多样性增强方法,构建了由支持向量回归模型和高斯朴素贝叶斯模型组成的Stack型集成学习回归算法框架,并基于此框架设计了面向电池健康状态和剩余容量状态评估流程。同时结合时间序列相似度量方法,提出了一种面向多属性时间序列数据和单属性伪循环周期序列数据的聚类分析算法框架,并基于此框架设计了面向电池组不一致性和故障识别的流程。提高了大规模部署和复杂环境下不同电池组高差异化特征的学习能力和识别能力。(4)基于以上数据挖掘算法构建了完整的电池群组数据分析体系,并搭建了面向通信基站电池组的实证研究平台,对算法有效性完成了实证研究。总的来讲,本文针对电池系统在复杂工况下的产生的高噪声、高维、高非线性数据空间,提出通过数据挖掘理论建立的电池群组数据分析体系解决数据清洗、特征提取和状态识别难题,实现了数据低错误率修复、高压缩比降维和高精度状态识别,并基于通信基站电池系统进行了验证研究。