模型未知下试验设计的构造

来源 :南开大学 | 被引量 : 0次 | 上传用户:hou0608
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
试验设计是统计学的重要分支之一,它不仅在理论上有重要意义,在实际领域也具有重大的应用价值。古典的试验设计方法,如正交设计、回归设计、区组设计、拉丁方设计、响应曲面设计等,已建立了丰富的理论。它们均假定模型的形式已知,但其中含有未知参数,要通过试验来估计其中的未知参数,并要求在一定的意义下,试验设计达到最优。这种设计我们称为模型已知下的试验设计。随着新技术和科学的飞速发展,人类面对的问题越来越复杂,需要突破古典试验设计强烈依赖于模型的限制;另外,随着计算机技术的发展,许多试验的前期研究,可以在计算机上进行,这可大大节省试验开支,又可显著加快研究进程。在计算机试验中模型不存在随机试验误差,与模型未知试验的模型(含随机误差)有本质不同.但是在试验设计和建模的要求上,两类试验有许多共性,因此本论文均把它们看作模型未知下的试验本论文将深入研究模型未知下的试验设计中的一些最新课题.包括:正交拉丁超立方体设计、正交列设计、嵌套空间填充设计、分片空间填充设计以及高水平和混水平因子超饱和设计的构造。另外,本文还将给出产生广义最小低阶混杂设计的一种方法,讨论般高水平因子设计中混杂和均匀性之间的关系,并给出广义最小低阶混杂准则与均匀性的偏差准则的些等价条件。近年来,基于计算机试验的替代模型(拟模型)在工程设计领域得到了广泛的应用。这主要是因为现实生活中的实际模型往往由复杂的方程表示,这些方程如此复杂以至于只能使用计算机得到近似的数值解。因此,这些方程不但不能准确地描述输入输出变量间的关系,而且计算起来耗时耗力。而拟模型可以在有效识别变量间关系的同时大大地缩短所需的计算时间。计算机试验没有误差,因此不需要随机化和重复试验,试验中的不确定性只是由于缺乏对输入输出变量间关系的认识而造成的。在计算机试验中应用最广泛的是拉丁超立方体设计,这种一维投影均匀分布的设计是由McKay, Beckman and Conover (1979)首次提出来的。拉丁超立方体设计最初的构造方法是对水平进行随机排序安排因子,因子之间难免具有较高的相关性。对回归模型而言,我们希望变量间是正交的,从而回归系数的估计之间是不相关的。当拟合一阶回归模型时,正交拉丁超立方体设计确保了线性效应估计间的不相关性;进一步当二阶效应,即平方效应和双线性效应存在时,我们还希望线性效应的估计与这些二阶效应的估计是不相关的。因此,我们希望找到有如下性质的拉丁超立方体设计:(a)因子间的线性效应估计是不相关的;(b)所有因子的线性效应的估计与所有平方效应和双线性效应的估计是不相关的。现在已有一些具备这两条性质的拉丁超立方体设计,比如Ye(1998)构造的L(2c+1,2c)和L(2c+1+1,2c);Cioppa and Lucas (2007)通过推广Ye的方法构造的L(2c+1,c+1+(2c))和L(2c+1+1,c+1+(2c)),其中正整数c≤11,Georgiou (2009)通过广义正交设计构造的拉丁超立方体设计。但是,他们所构造的设计相对于试验次数而言所能容纳的因子数太少。另外,由于拉丁超立方体设计要求水平数和试验次数相等,这使得正交拉丁超立方体设计的构造变得非常困难。因此,需要灵活的方法来构造新的正交拉丁超立方体设计,或者是寻找这类设计的替代设计。为了模拟现实中的系统,人们需要建立数学模型去表示现实的行为。模型可以取成不同的精度,如精细模型和简化模型,来满足试验者多方面的需求。在工程和科学领域,多精度的计算机试验有着广泛的应用。例如,考虑一个只涉及到两个精度的试验,低精度试验和高精度试验,分别用Dl和Dh表示。我们希望构造Dl和Dh满足下面三个原则(Qian. Tang and Wu,2009):节约:Dh中的试验次数少于Dl的试验次数(这是因为低精度试验比高精度试验便宜);嵌套关系:Dh嵌套在Dl内,即Dh(?)Dl(为了建模和校正两种试验的差别);空间填充设计:Dh和Dl在低维达到分层(假设真模型对设计空间中每个部分都同等看待)。此外,通常的计算机试验都是建立在假设输入变量是定量因子这一标准框架下的,但是存在一些计算机模型的输入变量是定性的。Qian and Wu (2009)建议用分片空间填充设计去实施既含有定性因子又含有定量因子的计算机试验。显然,分片空间填充设计是一个双精度的试验。这类计算机试验的构造是一个新的课题。超饱和设计常用于工业及其他科学试验的初期用来筛选活跃因子,在因子数目多而试验次数有限的情况下尤其有用。人们基于不同的考虑提出了很多不同的判断超饱和设计优劣的准则,而基于这些最优准则得到的最优设计可能包含高度非正交的列,甚至完全别名的列。因此,很有必要寻求一种判别列完全别名的简便方法。进一步,如果能构造出任意两列的近似正交性可以被控制的最优超饱和设计,那一定是很有意义的工作。另外,因子设计的一个最根本的问题是如何从候选设计中挑取一个好的设计。基于各种不同的考虑,涌现出了各种用以选择设计的最优准则,这其中最流行的包括基于广义字长型的广义最小低阶混杂准则和度量均匀性的偏差准则。它们之间有什么关系呢?它们何时等价呢?而且,由于广义字长型是一个向量,所以产生广义最小低阶混杂设计是一个较难的课题。如能给出一种方便产生广义最小低阶混杂设计的方法,将对理论和实际都是非常有用的。基于以上考虑,本论文主要进行了以下七个方面的工作:(1)构造具备性质(a)和(b),并且能够包含更多因子的拉丁超立方体设计;(2)通过放宽因子水平数等于试验次数的要求,构造一类适用于计算机试验的正交列设计;(3)构造适用于不同精度试验的设计;(4)构造适合既包含定性因子又包含定量因子的计算机试验的分片空间填充设计。(5)给出判别两列完全别名的等价条件,构造不含完全别名列的一系列最优超饱和设计,并且设计中任意两列的近似正交性是可控的。(6)给出一种方便产生广义最小低阶混杂设计的方法;(7)探究均匀性和混杂之间的关系,并讨论均匀性的偏差准则与广义最小低阶混杂准则之间何时等价。下面简要介绍一下各章的内容。第一章概述基本概念、符号,并给出后面章节要用到的几个引理。第二章给出了构造线性效应的估计之间不相关且与二次效应的估计也不相关的正交拉丁超立方体设计的方法。本章完全解决了满足性质(a)和(b)的拉丁超立方体设计L(2c+1,2c)和L(2c+1+1,2c)的构造问题。此种构造方法不但简单易行,而且所构造的设计在所有满足性质(a)和(b)的拉丁超立方体设计中因子数达到最大。同时,我们推广了该构造方法,使其能构造具有更灵活试验次数的拉丁超立方体设计,并且这些设计也满足性质(a)和(b)。在第二章的最后,证明了满足性质(a)和(b)的拉丁超立方体设计在某些给定的准则下也是最优的。第三章介绍了一类适用于计算机试验的正交列设计的构造方法。就计算机试验而言,虽然拉丁超立方体设计有着广泛的应用,经验表明因子的水平数足够多就好,没必要像拉丁超立方体设计要求的那样一定和试验次数相等,而且拉丁超立方体设计又往往难以正交。本章通过分组旋转正交表中的因子构造了一些适用于计算机试验的正交列设计,用以补充各种因子数和试验数组合的计算机试验的实际需要。这些正交列设计不仅在每个因子上有均匀分布的水平而且在一阶模型中有着不相关的线性效应估计。此外如果所旋转的正交表的强度大于等于三,那么所得设计的线性效应的估计与二次效应的估计之间也是不相关的。由于该种设计的因子数和试验次数之比比较大,所以它也可以应用于筛选因子试验。第四章给出了一种双精度设计的构造方法。这种设计的构造是个新的课题,因为现有的方法都是致力于构造单精度的试验。Qian, Tang and Wu(2009)认为嵌套空间填充设计适用于这种试验。本章,我们提出了系统构造双精度嵌套空间填充设计的方法,而且这些设计能达到很好的低维分层。第五章提出了多精度试验设计的构造方法。第四章构造了双精度的嵌套空间填充设计,但是有一些试验需要具有多精度的设计。例如,这些试验可以是物理试验、具体计算机试验和近似计算机试验的组合。本章采用伽罗瓦域分解的方法,产生的设计保证了低维的均匀性,而且这些设计是分片空间填充设计,因此此种设计也可应用于同时包含定性和定量因子的计算机试验。第六章构造了不含完全别名列的E(fNOD)最优和/或χ2最优的混水平超饱和设计。超饱和设计由于其在因子筛选试验上的显著作用而备受关注。本章给出了两列完全别名的等价条件,并利用等距设计和差阵构造了一系列不含完全别名列的E(fNOD)最优和/或χ2最优的混水平超饱和设计。该方法易于操作,可以构造许多新的不含完全别名列的最优混水平超饱和设计。同时,本章还证明了在列之间的近似正交性方面,所构造设计的任两列的fNOD值可以由初始设计的fNOD值所控制,也就是说如果原设计的fNOD值较小,所得设计的fNOD值也较小。为方便使用,本章还列出了系列新构造的最优混水平超饱和设计。第七章展示了一种寻找广义最小低阶混杂设计的新算法。因析设计无疑是在工业和科学研究中应用最广泛的试验设计。其成功之处在于能够有效的利用试验同时考查多个因子。最流行的选择因析设计的准则之一是基于广义字长型的广义最小低阶混杂准则。但是寻找具有广义最小低阶混杂的设计是个较难的课题,这是因为该准则具有序贯优化的特点。基于Hickernell and Liu (2002)给出的广义字长型和广义偏差之间的解析表达式,本章把产生广义最小低阶混杂设计的问题转化为约束优化问题,提出了一种解决该问题的有效算法,并构造了一系列的最优设计。第八章探查了一般多水平因子设计的均匀性和混杂之间的关系。基于广义字长型的广义最小低阶混杂准则和度量均匀性的偏差准则是选取设计的两种重要准则。度量均匀性的偏差准则中离散偏差、中心的L2偏差和可卷的L2偏差应用最为广泛。在本章,我们将这三种偏差表示成了设计的示性函数的二阶多项式,讨论了它们与广义最小字长型之间的密切关系,并给出了这些均匀性准则何时分别与广义最小低阶混杂等价的条件。这些密切关系说明均匀性准则可以用来比较因析设计,同时也说明了采用均匀设计的合理性。所有这些结果都说明正交性和均匀性关系密切,也说明了广义最小低阶混杂标准在均匀性下也是合理的。另外,把离散偏差和可卷的L2偏差表示成示性函数的二次型,有利于寻找相应的最优设计。
其他文献
无线局域网(WirelessLAN,以下简称WLAN)是近年来发展迅速的无线数据通讯网,但由于其传输介质的开放性,使得无线局域网的安全性成为威胁和阻碍无线局域网发展的重要因素。本文通过
期刊
本文介绍了基于CAXA系列CAD/CAM软件在粮机产品设计及制造中应用的一般过程和方法,并简要阐述了粮机产品设计及制造采用CAD/CAM技术的现实意义,以促进粮机行业CAD/CAM技术的广泛运用。
为了提高苹果采摘效率,设计了一种一次性完成苹果识别、定位、采摘、输送等功能的苹果采摘机。该机器由运行系统、苹果识别定位系统、采摘系统和手臂伸缩系统组成,保障作业的
为提高E-learning(数字化学习)中学生自主学习以及教师管理学习的效率,提出将决策树C4.5算法应用于数字化学习平台中的决策分析,设计了基于决策树的E-learning教学辅助系统,根
超声波定位方法应用很普遍,定位算法复杂,系统开发周期长,本文采用虚拟技术设计了基于Labview的超声波定位系统,提出了一种超声波定位装置的设计方案,可以实现方便快捷和准确
提出一种基于预先筛选的改进K秩协同频谱感知算法。利用各感知节点的检测信噪比对感知可信性较低的感知节点进行预先筛选,感知节点采用改进"K秩"融合准则进行协同频谱感知,之后
本文叙述了修补搪玻璃制品大块破损瓷层的方法。该方法可根据瓷层破 损的大小采用不同的修补件及修补法,具有修补简便、不受环境限制、不受瓷层破损尺寸大小局限之优点。采用