论文部分内容阅读
随着全球经济的高速发展以及科学的不断进步,现代工业过程规模越来越大,复杂性日益提高,工业生产也更加倚重于可以生产多种产品的高效过程。如何保证生产安全可靠运行、有效降低生产成本、提高产品质量并确保经济效益,成为现代工业面临的主要挑战。过程监控是解决该问题的关键技术和有效手段。其中,基于数据驱动的多元统计技术因其在处理高维、高耦合数据时所具有的独特优势而备受青睐。传统的多元统计方法对过程的限制条件较多,例如假设过程数据来自单一操作模态且服从高斯分布。但是,由于过程生产方案的变动、产品类型的改变或者过程本身特性等因素,生产过程往往来自多个操作工况或者分成多个操作时段。不同的工况或时段具有不同的过程特性,统称为多个模态。多模态已成为复杂工业生产过程中普遍存在的一种特性。本文针对复杂多模态过程在过程监测中所遇到的多种实际问题,对现有方法进行改进的同时,提出一系列包括模态识别、统计建模、数据特性分析等在内的新策略和新方法。本文主要研究工作包括:1.针对多模态连续过程无法真正实现全自动模态识别的问题,提出一种基于“粗划分-细识别”两步策略的全自动离线识别方法。首先,利用大分割窗口对过程数据进行粗分割并进行聚类,然后用一个短滑动窗口精确定位各模态的起始终止时间。“先粗后细”的识别策略有效降低了算法复杂性,并对噪声、奇异点等随机扰动有很强的冗余能力。另外,针对聚类时由于参数设置不当等原因而可能出现的各种不理想情况,进行分析处理,给出合理有效的识别结果,真正实现了多模态过程的全自动离线识别。2.针对多模态连续过程的统计建模和在线监测问题,巧妙结合了多模型方法和单一高斯混合模型方法在处理多模态过程时的优势,提出一种多高斯混合模型的过程监测方法。对于稳定模态,可根据其分布特性,建立单高斯模型或高斯混合模型。对于过渡模态,分别建立高斯混合模型。这样,既可以避免传统多模型方法离线模型繁多、模型参数复杂等缺点,又可以解决单高斯模型由于过渡子模态信息淹没而导致过程信息描述不完整的问题。在线监测时,如果当前模态可以完全确定,利用多模型方法的确定性思想,选择特定的监测模型进行监测,避免了无关子模型的不利影响。当模态信息不确定时,利用高斯混合模型方法的概率性思想,将所有可能的子模型以一定概率联合进行监测,避免了由于模态识别错误而导致的大量误报警情况。3.针对间歇过程由于不等长问题所带来的数据标准化、时段划分不准确、在线识别困难等一系列难题,提出一种基于“变滑动窗口-k近邻准则”的方法。利用可变的滑动窗口确定k-近邻的搜寻区域,大大降低了计算成本,同时考虑了时间的概念,使局部信息更加准确。每个样本的k-近邻相当于等长过程中的时间片矩阵,可以用来标准化该样本并提取样本的负载特性,解决了时间错位对标准化以及过程相关特性的影响。该方法避免了批次数据等长化处理,而且并不要求过程有足够的批次信息,因此同样适应于那种过程反应慢、不易获取大量建模数据的间歇工业过程。4.针对间歇过程的非线性问题,推导了高维特征空间中核负载矩阵的相似度指标,并根据该指标进行时段划分及监测。现有算法在时段划分的过程中一般只考虑过程的线性特征,而忽略了非线性特征的影响。所提新方法在时段划分时充分考虑了非线性特征的影响,使非线性间歇过程的时段划分更加合理,在此基础上的非线性过程监测策略也更加准确。5.针对实际应用过程中多元统计方法的选择问题,提出一种基于数据特性分析的过程监测方法。传统多元统计方法建立在各种各样的前提假设下,如果不考虑这些限制条件,盲目选择算法,则可能给出错误结论,因此在实际应用时应根据实际情况选择适用的解决方案。大多工业流程并不具备数据特性的先验知识,因此提出了一种数据特性分析方法,对过程变量相关关系以及数据分布特性进行测试判断,并根据分析结果自动选择合适的监测方法,有效避免了由于方法选择不当而造成监测性能下降的情况。上述方法针对复杂多模态工业生产过程在实际应用中遇到的各种问题,提出了新的解决思路和方案。利用TE过程、注塑过程等多模态过程对这些方法进行仿真验证,并与不同的方法进行比较,实验结果表明了算法的有效性。最后,在总结本文研究的基础上,对未来工作进行了展望。