论文部分内容阅读
二水平因析设计在实践中是一种非常常用的试验方案,在很多科学研究项目里,我们经常需要了解的是一些二水平因子的效应;二水平因析设计更常常用于因子筛选试验。
二水平因析设计的结构相对比较简单,它是因析设计的基础理论。许多重要的开创性的因析设计理论都是首先在这种设计里提出来,然后再被推广到更为复杂的情形中。这篇博士论文着力于现代二水平因析设计理论的几个方面,包括基础的混杂结构和别名性质,一些选择最优设计的准则及其与混杂结构的联系,也包括近来快速发展的实用性非常强的稳健参数设计。其中关于非正规设计混杂结构的结果具有较好的理论意义。
第一章我们讨论因析设计的混杂结构。这里所说的一个设计的混杂结构是指它的别名集的结构、同一别名集内的效应值之间的关系以及不同别名集的效应值之间的关系.为了便于论证、避免混淆,我们首次定义了因子效应的表示概念。我们称效应e在设计F中的对照为这个效应的表示,记作E<,F>(e)。这个效应e的值则记为V(e),注意V(e)的大小并不依赖于设计F的选择。
因为上世纪三十年代R.A.Fisher在英国 Rothamsted农业试验站的开创性工作以及 F.Yates和 D.J.Finney的突出贡献就是基于正规设计,经过研究者不断的努力,正规设计的混杂关系在理论上正在逐步清析,正规设计的别名结构也可以较好地用代数子群理论加以描述。
为了克服计算手段的不足,当年Yates提出的计算因子效应值的算法对试验者非常方便。在此基础上Wu and Hamada(2000)给出了计算因子效应的计算公式。
其中τ(x<,i>)表示水平组合x<,i>的处理效应。这个结论可以用线性回归严格证明。
尽管对于正规部分因析设计,试验者沿用上面全设计的公式,其实在理论上这是基于一定的假设的。在Mukerjee and Wu(2006)中作者用投影几何的方法严格证明了正规设计的别名集内因子效应值的关系,其中A<,i>代表一个别名集,而E<,F>(A<,i>)则是这个别名集中所有效应的共同表示。方程右端正是Wu and Hamada(2000)计算正规设计中因子效应的公式。
在Bose(1947)关于正交阵的划时代理论之后,人们将视野从正规设计开拓到一般正交设计上来。Plackett and Burman(1946)给出一系列非正规设计如12个水平组合的正交设计。这些设计有较复杂的别名关系,Hamada and Wu(1992)称之为部分别名关系,Kulahci and Bisgaard(2006)讨论了它的限于二阶因子效应的别名矩阵。受制于缺少象正规设计的严格的因子效应值的混杂结构,Tang and Deng(1999)和 Deng and Tang(1999)虽然将正规设计的MA准则(我们称之为最小低阶混杂准则)推广到非正规的情形,却没有给出严格的理论依据。
本篇论文在第一章对非正规设计因子效应混杂问题给出了清楚明确地解答,这个结论不止是适用非正规正交设计,同时也适合非正交的任意部分因析设计。所以它的理论价值同时也适合平衡和不平衡的超饱和设计。通过引进单位子群及非正规设计的别名集的概念,其中b<,ij>是E<,F>(A<,i>)与E<,F>(A<,i>)的内积的n分之一。这个结论同时也涵盖了前面提到的全设计因子效应的计算公式、正规设计的因子效应混杂关系。
在第一章我们还给出利用非正规设计混杂结构来估计重要的因子效应值的一种方法,从中我们可以看到非正规设计优于正规设计的一个方面。
论文的第二章,我们从混杂结构的视角出发,审视了现有的针对正规因析设计和非正规因析设计的最优准则,得到一些新的结果并提出相关的新的准则。
MA 准则是由 Fries and Hunter(1980)提出,它以正规设计的定义对照子群为基础,通过顺序最小化字长型来选择最优设计。近二十年来MA准则成为正规设计理论的主流,许多工作都是沿着这个方向展开的。它的权威性最近受到多方面的质疑。Zhang et al.(2006)发现 MA 准则并非真正意义下的最小低阶混杂准则,并给出一个新的GMC准则(称为一般最小低阶混杂准则),该准则能够全面利用所有别名集来考量设计低阶效应的混杂程度。我们从混杂结构的观点出发进一步分析评价了MA准则,它实际上是选择能够最好地估计效应值V(I)的正规设计为最优设计,即总均值效应I受到有可能的最轻微的混杂。我们证明了MA最优设计不能最好地去估计其它重要的效应,即其它重要的效应不能同时也被最轻微地混杂。在比较简单的情况下MA最优设计确实能平衡地照顾各个需要估计的效应。但复杂情况下MA设计不一定能达到这种平衡,因此我们提出了关于平衡的概念及相应的平衡准则。同时我们给出最大分辩度准则、纯净效应准则、GMC准则的分析及其相互关系,给出它们和平衡准则的关系。
我们也研究了针对非正规因析设计的最小G-混杂准则和最小G<,2>-混杂准则。通过混杂关系我们发现,这些最优准则的目的就是降低用 ? 来估计V(I)的风险。基于此观察,我们发现上面准则中的一些不合理的成份,并提出了一个新的准则-最小 G<,3>-混杂准则。这个新准则对于超饱和设计也有一定的意义与针对超饱和平衡设计的最小E(s<2>)准则有一定关联。
在论文的第三部分,我们讨论了关于选择最优二水平稳健参数设计的问题。由于稳健参数设计在理论上的重要性及其在工业中的应用价值,自从Taguchi(1987)提出稳健参数设计以来就受到学者们及工业领域越来越多的关注。二水平稳健参数设计是非常重要的二水平因析设计中的一种。假设系统的表现受到l<,1>+l<,2>个因子的影响,其中l<,1>个是控制因子,这些因子的水平一但选定在常规运行中就不能改变;另外l<,2>个是噪声因子,这些因子的水平在常规运行中是不能控制的。稳健参数设计的目的就是选择好的控制因子组合,使得系统的表现不会由于噪声因子的水平变化而产生显著的波动。我们用2+l<,2>-m>来表示一个有2+l<,2>-m>个水平组合的正规设计矩阵。
文献中很多作者在选择用于稳健参数实验的最优设计矩阵方面做了很多的贡献和工作,如 Wu and Zhu(2003)、Bingham and Sitter(1999)和Zhu(200a)。但他们主要的方法还是基于字长型及其推广形式,而这些形式已被发现不能提供足够的有关因子效应之间相互混杂的信息。通过一个例子发现,基于他们给出的一个最优准则下的最优设计并不能纯净地估计出最多的受到关注的因子效应值。我们有理由说,即使是对于稳健参数设计试验,效应等级原则(effect hierarchy principie)也是有效的;但试验者对因子效应的兴趣或关注点并不完全由它潜在的效应值的大小来决定,而是由稳健参数设计的目的决定的。所以我们定义了两种因子效应排序:一种是基于试验者的兴趣,另一种是由效应等级原则决定。通过与Zhanget al.(2006)相似的方法,我们提出来出一种别名型用来衡量感兴趣的因子被低阶效应混杂的严重程度。一个新的准则随即被给出来,用于挑选最优的二水平设计矩阵以满足稳健参数设计的特殊性。在附录中给出了一些最优设计的表格以方便参照。
第一种因子效应排序是基于 Wu and Zhu(2003)提出来的如下数字法则,其中e<,i,j>表示一个由i个控制因子和j个噪声因子交互作用产生的因子效应,排序就是按照它们权重W(e<,i.j>)由小到大来排列,称这个排序为兴趣排序。排在第i级的因子效应记为(i)-阶因子效应,i的值越小越受到关注。
另一个效应排序是按照它们的字长,遵照效应等级原则,由短至长进行排列。称这个排序为潜在显著性排序。
如果一个因子效应被正好k个j-阶因子效应别名,它称为被j-阶效应以k级严重度别名。
根据以上最小兴趣低阶混杂准则,在三阶以上因子效应可以忽略的情况下,我们在附录中给出了利用计算机搜索的最小兴趣低阶混杂设计的表格。通过与 Wuand Zhu (2003)中给出的J-准则下的最优设计比较,我们发现最小兴趣低阶混杂设计在估计感兴趣的因子效应时具有一定的优势。