论文部分内容阅读
机器的出现使生产效率和生产安全得到了提升,但机械设备的故障同样也会导致财产损失和人员伤亡。随着工业过程不断向着大型化、复杂化的趋势发展,传统的依靠对每个变量实施独立监控的方法不再可行,并且建立精确的解析模型也越来越困难。与此同时,随着集散控制系统的广泛应用,从多个角度反映系统运行状态的大量数据被记录了下来。于是,为了进一步提高过程监控的效率,数据驱动的故障检测方法开始兴起。实际工业过程通常有多种复杂的特性,如多工况、时变、复杂数据分布等,而在最初进行研究时,人们会通过设定一些假设条件如过程运行在单一稳定工况下,变量服从高斯分布等,以此来简化研究问题。但是随着研究工作的深入开展,就需要克服这些假设,研究适用性更强的故障检测方法。本文旨在针对工业过程中的复杂数据分布、多工况和时变问题,通过利用数据局部和全局结构信息,提出新的特征提取方法,进一步提高故障检测模型的精度。具体内容如下:(1)针对单工况下训练数据具有复杂数学分布的问题,提出了一种基于局部线性嵌入(Locally linear embedding, LLE)和支持向量数据描述(Support vector data description, SVDD)的故障检测算法。该算法充分利用了LLE在特征提取和SVDD在建立统计量时均不受数据数学分布约束的优势,所以可以建立精确的监控模型。此外,利用最小二乘回归策略,解决了LLE不能得到原始空间到特征空间投影矩阵的问题,保证了在线监控的效率。(2)针对传统监控方法在特征提取时会破坏原始数据局部或全局结构的问题,提出了一种局部-非局部嵌入(Local and nonlocal embedding, LNLE)算法。LNLE利用LLE的目标函数约束样本与其近邻点间的相对位置,同时设计了一个新的目标函数约束样本与其非近邻点间的相对位置,最终通过求解双重优化问题,将原始数据的局部和全局结构信息完整的保存在特征空间中,进一步降低了特征提取过程中的信息损失。(3)针对训练数据来自多个生产工况即训练数据的数学分布具有多峰性的问题,提出了一种协调混合因子分析(Aligned mixture factor analysis, AMFA)算法。AMFA在传统多模型法的基础上,通过把样本在特征空间中的表达具有唯一性作为优化过程的约束条件,将各个局部模型协调整合得到一个全局模型,从而使监控模型不仅包含每个工况的独有特征而且包含工况间数据的相关性信息。同时,在线监控时,由于不需要判断新样本属于何种工况或应该使用哪个局部模型进行故障检测,所以监控效率得到了提升。(4)针对现有聚类算法在处理多工况训练数据时无法自动求得工况数以及部分聚类算法可能陷入局部最优的问题,提出了一种工业过程数据聚类算法。该算法利用了样本的时序相关性和工业数据中同类数据总是相邻的特点,通过寻找扩展矩阵中的“断裂点”,提高了聚类的效率和精度。此外,在将局部模型整合为全局模型时,通过同时约束样本与其近邻点及非近邻点间的相对位置,并引入权重系数平衡二者的比例,在特征提取过程中更完整的保存了原始数据的局部和全局结构。(5)针对同时具有时变、多工况和复杂数据分布的工业过程,提出了移动窗局部离群因子和移动窗局部离群概率两种故障检测方法。利用两种方法基于近邻点计算局部密度从而不受复杂数据分布影响的优势,保证了监控模型的精度。同时,分别针对两种算法提出了相应的移动窗快速更新策略,提高了模型更新速度,保证了监控效率。而对于工况变化过程,又提出了半监督的模型切换机制,通过短时间内强制接受每个新样本使监控模型能迅速跟踪工况的变化。为了减小将故障或扰动更新到窗口中的概率,分别针对两种算法提出了“盲更新”的终止条件,保证了算法的持续有效性。本文在对上述方法进行理论分析的同时,在数值例子、非等温连续式搅拌釜(Non-isothermal continuous stirred tank reactor, CSTR)和田纳西伊斯曼(Tennessee eastman,TE)过程的仿真框架下,通过设计不同的测试情景并与文献中类似的方法进行对比,验证了本文提出算法的有效性和实用性。