论文部分内容阅读
工业生产过程变量的准确预测可以为工业系统的调度及决策工作提供重要指导,也是预测控制技术的重要组成部分。目前,基于数据的预测方法被广泛应用于生产过程变量预测中。然而鉴于工业数据普遍具有高噪声、含缺失点等特点,难以准确拟合过程变量之间的复杂非线性关系,从而使得对模型精度的提升提出了巨大挑战。因此,本文研究了复杂工业数据驱动的过程变量预测方法,具体内容如下:针对过程变量预测中的特征选择问题,提出一种基于局部线性化变分推理的嵌入式特征选择模型。通过一种基于局部线性化的后验概率高斯近似方法,解决了核函数参数的后验变分概率分布估计问题,进而对相关特征做出选择。此外,相比于普遍采用的点估计而言,本文推导出模型中其他参数的后验概率。针对输入数据不确定性的建模问题,提出一种考虑输入噪声的相关向量机预测模型。鉴于直接考虑含输入噪声建模会导致边缘似然函数的精确解难以计算,设计了一种基于完全期望和完全方差准则的边缘似然函数高斯近似方法,并针对该模型权值的后验概率推理问题,采用马尔科夫链-蒙特卡洛抽样方法来近似估计权值后验分布的均值和协方差矩阵。考虑工业时间序列训练样本集存在缺失点的情况,提出一种基于相关向量机的非完备训练数据建模方法。该方法直接利用含缺失点的数据进行模型训练而无需进行数据填补,为此采用了两种缺失点推理方法,包括基于期望最大化算法和最大化边缘似然函数的方法:前者可以给出输出缺失点的后验概率分布,而后者只计算出点估计值。针对含缺失点的测试样本的实时区间预测问题,提出一种基于相关向量机的高阶动态贝叶斯网络区间预测模型。在网络推理阶段,对于含缺失点的样本集,直接采用似然加权近似推理算法获得未来节点的概率分布,进而构造预测区间。此外,为解决似然加权算法的耗时问题,设计了一种基于变分推理的动态贝叶斯网络两阶段推理方法。为了验证本文所提方法的有效性,采用国内某大型钢铁企业的副产煤气系统运行数据和国内某磨矿厂运行数据进行了仿真实验,同时也对几种人工数据集和标准数据集进行了实验。实验结果表明本文所提方法在嵌入式特征选择问题上取得了较高的预测精度和较好的特征选择效果,并且在非完备数据集建模和模型输入不确定性建模问题上能够取得较好的预测效果。