因析设计的最优准则与构造性质

来源 :南开大学 | 被引量 : 0次 | 上传用户:wangyang062011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多科学研究或工业试验中人们通常会同时研究两个或两个以上的输入变量对试验结果的影响。因析试验(factorial experiment)是研究这类问题最常用的工具。这些输入变量称为因子,输入变量的可能取值称为因子水平。 本人积极参与了由导师所开创的这一新理论的研究工作,特别研究了一些计算AENP和寻找GMC最优设计的方法。在第2章我们首先介绍了文章Zhang,Li, Zhao and Ai(2007)的理论工作,然后在此基础上给出了计算AENP和搜索GMC最优设计的普通方法。这个方法虽然非常易于理解和应用,但是需要计算定义对照子群和所有的陪集,所以当生成因子较多时就不适用了。因此本文在因子混杂结构矩阵和因子混杂结构字型的基础上给出了搜索GMC最优设计的顺次算法。这个方法避免了计算定义对照子群和所有的陪集,所以当生成因子个数比较多时可以极大地节省计算AENP的时间。这一方法也利用GMC最优设计的性质极大地缩小了搜索的范围,显著地节省了搜索最优设计的时间。我们应用此方法得到了大量的GMC最优设计,并在第2章附录中列出了32个run和64个run所有的GMC最优设计以及MA最优设计。区组设计在科学试验中应用非常广泛,通过分区组可以减小试验的误差,提高估计的精度。如何找到一个好的分区组方案是一个非常重要的问题。很多分区组的准则和区组设计的构造方法都是基于MA准则和纯净准则的。与不分区组的情况类似,基于MA准则的各种最优分区组准则也存在一些问题。最近的文章Zhang,Wei and Li(2008)把GMC理论推广到分区组情形,并且圆满地回答了这些问题。在第3章开始我们介绍了该文的主要结果。在以前的文献中人们认为区组因子的各阶效应是显著的。所以在考虑设计时都要保证区组因子之间是相互独立的。该文根据实际问题的需要首次明确提出把分区组的情况分为两类。一类是传统的,把试验单元以非齐性分成2r个区组,而把这2r个区组看成由r个两水平区组因子生成的。而各阶区组因子效应认为都足同等显著的。另外一类是,一共有r个两水平区组因子,每个区组因子代表不同的实际含义。这时候各阶的区组因子都有明确的含义,而且不同阶的区组因子重要性不同。Wu and Hamada(2000)提到过这个想法,但是没有把这两种分区组情况分开看待,也没有给出进一步论述。对于第二种分区组情况,可以象处理因子那样看待,三阶及以上的区组效应可以忽略不计。首先把所有的处理因子效应按照其所在的不同陪集分成四类:g-类、b-类、m-类和φ-类分别表示出现在包含总均值的陪集(即定义对照子群)、包含不可忽略的区组效应的陪集、包含主效应的陪集和其它陪集的处理因子效应集合。然后根据各个集合内不同处理因子效应之间的混杂关系,定义了分区组情况下的混杂个数型,即BAP。针对两种不同的分区组情况.给出了相应的分区组的一般最小低阶混杂准则,即B1-GMC和B2-GMC。证明了在第一种分区组情况下,基于MA准则的四种准则的字型也是BAP的某个函数。也清楚地找到了已有各个准则下最优设计很多情况下会出现矛盾的原因。同时证明了第二种分区组情况下,B2-GMC最优设计所具有的优良性质。怎样找到两种分区组情况下的最优设计也是一个很重要的问题。我们在第3章也给出了分区组情况下的因子混杂结构矩阵和因子混杂结构字型。并在此基础上给出了搜索B1-GMC和B2-GMC最优设计的顺次算法。这一方法同样极大地简化了计算BAP,而且生成因子个数比较多时同样适用。并且利用B1-GMC和B2-GMC最优设计的构造性质缩小搜索的范围。本章附录中列出了32个run的B1-GMC和B2-GMC最优的设计,以及基于MA的四种准则的最优设计。当试验中某些因子的水平不容易改变,或者改变水平的成本非常高时,人们通常会使用裂区设计。在裂区设计中水平不容易改变的因子称为整区因子,记为WP因子;而水平相对容易改变的因子称为子区因子,记为SP因子。在实施裂区设计时,我们首先在WP因子的水平组合中随机挑选一个,然后在其固定的情况下,随机地选择SP因子的水平组合。只包含WP因子的效应称为WP型效应,其它效应称为SP型效应。部分因析裂区(FFSP)设计可以通过定义字得到。FFSP设计的设计阵和普通的部分因析设计的设计阵形式上完全相同。Huang et al. (1998)把最小低阶混杂的概念推广到FFSP设计中用来寻找最优的FFSP设计。由于没有考虑WP因子和SP因子之间不能交换,所以仅利用最小低阶混杂准则还不足以找到好的FFSP设计。Bingham and Sitter(2001)建议在最小低阶混杂设计中寻找能够使得B1=0并且B2达到最小的设计,这里Bi表示和WP因子混杂的i-阶SP因子的个数。Mukerjee and Fang(2002)在此基础上提出了最小二阶混杂(minimum secondary aberration])(AISA).Kulahci et al.(2006)明确指出最小低阶混杂作为FFSP设计的设计准则存在某种缺陷,并对裂区设计提出一个纯净两因子交互效应个数最大的设计准则的改进形式。Yang,Li,Liu and Zhang(2006)把FFSP设计的两因子交互效应分成了三类,分别是:WP2fi、SP2fi和WS2fi。并且研究了FFSP设计存在纯净效应的充分必要条件。Zi,Zhang and Liu(2006)给出了FFSP设计包含的纯净两因子交互效应最大个数的界。在第4章我们把一般最小低阶混杂思想推广到了FFSP设计中。首先把所有的效应按照其所在的混杂陪集分成了三类,分别为g-类、ω-类、s-类。其中g-类表示该因子所在的集合包含总均值,即定义对照子群;ω-类表示该因子所在的集合包含WP型效应;s-类表示该因子所在的集合只包含SP型效应。在这个分类的基础上,定义了FFSP设计的的混杂效应个数型(SPAP)。基于效应排序原则和SPAP,我们给出了裂区设计下的一般最小低阶混杂准则,即SPGMC准则。最小低阶混杂准则、最小二阶混杂准则和纯净效应准则都可以看作最优化SPAP的某个函数。对于2(n1+n2)-(k1+k2)裂区设计,令p1=n1-k1,p2=n2-k2,p=p1+p2=(n1+n2)-(k1+k2)。如果n1≤2p1-1并且n2≤2p-1-2p1-1,则SPGMC最优设计所有主效应都纯净,而且使得纯净两因子交互效应的个数达到最多,并且在此基础上顺次最大化纯净的不与WP型效应混杂的SP型两因子交互效应、纯净的WP型两因子交互效应和纯净的与WP型效应混杂的SP型两因子交互效应。根据实际问题的需要,也可以通过重新组合或者排列SPAP得到新的最优准则。超饱和设计在工业中有非常广泛的应用,因为这种设计可以有效地减少试验次数降低试验成本。由于试验次数不能满足估计所有的主效应,所以超饱和设计的数据分析是一个很复杂的问题。近年来研究者提出了一系列分析此类数据的方法。比如Chipman,Hamada and Wu(1997)提出了一种贝叶斯分析方法;Beat-tie,Fong and Lin(2002)提出了一种两阶段的贝叶斯分析方法;Li and Lin(2002,2003)给出了一种带惩罚项的最小二乘法;Lu and Wu(2004)提出了分阶段法;Zhang,Zhang and Liu(2007)提出了基于偏最小二乘的分析方法。第5章介绍了一种对照正交聚类方法,通过这个方法可以比较全面地描述因子之间的混杂关系,并且可以指导实验者更加科学地安排因子。在对照正交聚类方法的基础上提出了一种数据分析方法,称为对照正交聚类分析方法(contrast-orthogonality clusteranalysis)(COCA)。通过模拟结果和实际例子证明COCA方法非常有效。另外,由于COCA方法主要利用聚类方法和逐步回归方法,所以在实际中非常易于理解和使用,在第6章总结了文章的一些主要结论,同时提出了几个值得进一步研究的问题。
其他文献
流体力学中的Navier-Stokes方程在气象预报,核武器模拟,航空航天等领域有着广泛的应用。对于确定性的Navier-Stokes方程,国内外做了许多研究,而对于随机的Navier-Stokes方程研究
【摘要】近年来,我国水利水电建设快速发展,在建项目的数量和规模都达到了前所未有的水平,各种新技术、新工艺、新设备不断涌现出来。本文对近些年水利水电堤坝抢险加固工程中常用的高压喷射灌浆防渗墙技术作简单的探讨。  結合永堌水库工程基坑高喷防渗墙施工实例,从施工参数及造孔、喷射灌浆、漏浆处理、孤石处理、事故停喷、养护等诸方面,分析各种因素对高喷防渗墙质量的影响,提出相应防治措施,并对高喷防渗墙质量进行了
期刊
随着云计算的普及,越来越多的用户将自己的数据外包存储到云服务器上。云存储服务最大的好处就是用户可以随时随地的使用任何设备访问存储在云服务器中的数据。因此,它正逐步
本文通过对地下消防水池的结构本体设计和给排水专业设计分析,全面而细致的阐述了消防水池在设计过程中应注意的关键性细节问题,深入分析了各种问题产生的根源并提出了诸多行之
期刊
约束矩阵方程(组)问题是指在满足一定约束条件下的矩阵集合中求解矩阵方程(组)的问题。约束条件不同,或矩阵方程(组)不同,则得到不同的约束矩阵方程(组)问题。  本文主要研究
在Ramsey理论中,求各种Ramsey类数的精确值及其适度的上、下界是研究的重点和难点。本篇硕士论文主要研究组合数学中的van der Waerden数和Ramsey数。它以van der Waerden问题
模糊有界集以及模糊全有界集是I-拓扑向量空间中极为重要而又基本的概念,Katsaras[18]、吴从,所、方锦暄[2]利用不同的工具先后给出了模糊有界集的定义,事实上,这两个定义是等价