论文部分内容阅读
迈入工业4.0时代,制造业的主要特征转向智能和互联,企业的运营越来越依赖于信息技术。制造业整个价值链、制造业产品的整个生命周期都涉及到诸多的数据,数据量的暴涨给该行业带来宝贵机遇的同时也带来了严峻的挑战。首先,数据“维灾难”问题导致其处理变得十分困难,部分算法甚至失效;其次,数据中包含的噪声及异常较多,而传统单变量时序数据的分析过多地关注趋势预测,忽略了异常时段所包含的关键信息;再者,多变量时序数据往往具有非平稳、非线性及相关等复杂特点,致使缺乏有效的方法对其进行处理。因而,为了充分发挥工业大数据的应用价值,将大数据分析技术用于辅助智能工厂的调控、管理及决策等过程,本文针对上述三个方面展开了对面向智能工厂的大数据分析工具的探索,并初步研究了工业大数据特征提取工具集: (1)针对工业大数据中的“维灾难”问题,利用线性特征提取方法实现降维的目的。在传统增量线性判别分析(Incremental Linear discriminant Analysis,ILDA)的基础上,利用主成分分析(Principal Component Analysis,PCA)对样本完成初步降维,并量化各主元的判别能力,利用熵值法确定各主元贡献率和识别能力的权重,以综合指标对各主元进行筛选,以便在解决线性判别分析(Linear discriminant Analysis,LDA)面临的小样本问题的同时最大限度保留样本的变异信息和判别信息。 (2)针对传统时序数据分析中容易忽视异常的问题,本文对时间序列异常模式挖掘进行研究,并针对线性分段中局部算法过于精确的问题,在基于趋势点的分段方法基础上,提出基于趋势点提取序列重要点的分段模式表示方法,提取出时间序列重要的趋势特征。通过仿真实验对提出的分段算法与基于趋势点的方法在异常模式挖掘中进行对比,结果表明本文提出的分段方法能更加准确、灵敏地检测到异常模式。 (3)针对多变量时间序列数据特点较为复杂,变量之间具有较强的相关性,以致于缺少有效方法对其进行处理,本文将多元多尺度熵方法应用于多元设备信号故障特征提取,将多元时序变量用多元熵值进行表示,并提取出关键尺度下的多元熵值作为样本特征,输入分类器进行故障分类,以验证其提取特征的有效性。 本课题依托工信部2016年智能制造综合标准化试验验证“开关设备数字化车间运行管理标准研究与试验验证”项目,对面向智能工厂的大数据特征提取工具集进行研究,指出部分方法在工业大规模数据上应用时面临的问题,并提出了相应的改进方法,对其进行仿真验证。结果表明,本文对面向智能工厂的工业大数据分析工具集的研究具备参考价值。