论文部分内容阅读
真实世界实验系统或计算机仿真模型中普遍存在一定的不确定性。引起这些不确定性的原因有很多,例如:模型缺陷或偏差,数值误差,实验观测误差和计算机模型仿真或实验测量中有效数据缺失的插值产生的误差等等。因此在实际应用问题中经常需要基于仿真或预测结果做出一些重要的决定或决策。如果能够将不确定性量化,这些基于预测或者仿真结果的决策或控制策略的可信程度都将会大大改善。传统的不确定性量化方法需要大量访问实验系统或计算机模型获取数据。当系统或仿真模型非常昂贵时(即每次访问时间消耗较大),传统的不确定性量化方法所需的时间成本变得无法承受。对实验系统或计算机仿真模型构建一个高效的替代模型是一种简单直接的解决方法,同时采用高效的替代模型的方法可使传统经典的不确定性量化方法继续延用。高斯过程回归模型具有高效、灵活、可量化预测值不确定性信息等优点。这些优点使高斯过程回归模型成为众多替代模型中一个较好的选择。本文旨在通过使用高斯过程作为昂贵系统或模型的替代模型,探索高斯过程回归模型在各种不确定性量化问题中的应用。具体而言本论文将研究如何利用高斯过程解决失效概率估计、后验密度估计和实验设计三个问题。下面我们将简要陈述我们在这三个问题上的研究工作。现实工程系统中不确定性或随机性的存在可能会导致系统出现异常,甚至失效的情况。因此在工程领域中,系统的失效概率估计或高精度异常检测是一个非常重要的课题。但在实际操作中,失效概率的估计需要对系统模型进行大量仿真。本文针对昂贵系统的失效概率估计问题提出采用实验设计的方法构建高精度的失效边界替代模型。这种方法摒弃对整个参数空间构建精确模型,仅在失效边界的参数空间附近建立精确模型,减少了所需的实验数据量和访问真实昂贵系统的次数(因为失效边界的参数空间只是整个参数空间的一部分)。数值实现中提出利用正态分布优越的解析性质将常规实验设计框架中所需的双层积分减少为单层积分,有效地提高算法的计算速度的同时得到了高精度的失效边界模型。该实验设计框架允许同时设计多个实验点,有利于工程实现中并行系统的使用。我们研究的第二个问题是后验密度估计问题。贝叶斯推断是一种将数学模型与数据信息相结合,推断模型参数的方法。本文考虑在昂贵似然函数条件下,通过贝叶斯推断的方法估计已知实验数据的参数后验分布。我们提出利用指数高斯过程回归模型和建议分布的积的形式近似似然函数和参数先验分布的积。该方法有利于降低构造似然函数替代模型的难度。我们提出通过将前一轮后验分布作为本轮建议分布的策略构建主动实验设计算法,逐步提高高斯过程回归模型替代模型的精度。最后通过数值实验验证高斯过程回归模型在参数后验密度估计问题中的有效性。我们研究的第三个问题是实验设计问题。在包含实验参数和设计参数的实验系统中,人们往往对设计参数并不感兴趣。但不同的设计参数会改变实验的输出数据,影响统计建模的精度。本文考虑在以统计推断为目标的实验设计中,对设计参数进行最优设计。我们提出利用多任务高斯过程回归模型模型近似昂贵实验系统的逆过程,通过最大化期望效应寻找设计参数的最优设计值。提出分别采用最优设计准则和最优设计准则作为效应函数,量化设计参数取不同值时模型不确定性的大小。我们通过降低数据中的不确定性,更加准确地估计实验参数后验分布。通过数值实验比较在设计参数取不同值时实验参数的后验边际分布验证最优设计的有效性。