论文部分内容阅读
科学技术的发展使人们对客观世界不断要求更为深入的认识,然而在许多领域,如化学化工、生物医学等,仍有许多对象的内在机理暂时还难以为人们所了解,但人们仍迫切需要了解和研究它们的自变量和因变量间的定量关系。这时,根据采集研究对象的观测数据建立模型,用以对自变量和因变量之间的定量关系作出预测,是科学工作者重要的基础性工作之一。由于观测数据不可避免地会存在偏差,而某些严重的偏差会导致整个模型的不准确,所以对模型离群点的检测具有非凡的意义。由此看出,局外点检测对于注重试验和数据采集的化学化工领域,其重要性不可忽视。本文结合化学化工的数据特点,对局外点检测方法的理论基础、应用需求、研究思路、技术关键和发展进程进行了综合分析。分别针对线性和非线性参变对象,概要介绍了当前适用的检测方法,包括各类判别标准,直接和间接方式,单个和多个局外点检测,经典和现代方法。本文利用近几年发展迅速的支持向量机(SVM),结合稳健建模的思想和径向基网络的特点,应用于局外点的检测中,试验证明该方法具有良好的效果和优越性。主要成果如下:1)提出了基于支持向量机线性回归方法来检测线性建模中的局外点。线性建模最常用的是线性回归方法,其主要是通过最小二乘法求解,但最小二乘法对局外点非常敏感,可以让模型面目全非。而支持向量线性回归中的敏感区域的存在给检测局外点带来了可能,本文正是用此方法提高了线性回归建模的鲁棒性,并有效检测出局外点。2)提出了基于支持向量机(SVM)和径向基网络(RBF)相结合的方法来检测非线性化工建模中存在的局外点。两者各自都是建模的有力工具,但各有优缺点,支持向量机用于数据拟合时精度较高,且结构复杂度取决于支持向量的数量,由于其优化问题可以通过二次规划求得全局最优点,从而避免了陷入局部极值点的情况,和其他神经网络对比显现出很大的优势,但支持向量机的参数选择大多是靠经验,而模型的精确度和参数有很大的关联。径向基网络也是建模的好方法,通过学习可以自动调节参数,但该网络的初始结构不易得到,尤其是隐层的节点数较难确定。本文将两者结合,由支持向量机确定初始结构,再通过径向基网络的自动学习能力调节参数,两者互补,效果明显。其中,将稳健建模的方法应用于前面提到的径向基网络的学习中,从而进一步提高了模型对局外点的鲁棒性。传统的径向基网络学习是基于最小二乘法来得到网络参数的,即目标函数为误差平方和,而该方法对局外点十分敏感,故本文提出通过稳健建模的方法来训练得到径向基网络的参数。总之,论文对化学化工建模中局外点检测方法进行了较为全面深入的探讨,为化工稳健建模提供了新途径。文章最后对所做的工作进行了总结,并提出了进一步的发展方向。