论文部分内容阅读
超饱和设计是一种主效应个数大于处理组合个数的因子设计,它具有各水平等重复出现且没有完全别名因子的性质,其最主要用于因子筛选。最近几年,已经提出了许多的超饱和设计分析方法。其中Lin(2002,2003)介绍了一种基于惩罚的最小二乘估计,SCAD方法,这种方法对超饱和设计分析非常有效,但是SCAD方法需要一个逐步回归给出的初始值。
本文中,我们介绍一种结合了岭回归和Lasso的加惩罚回归,ElasticNet方法,该方法具有和Lasso相同的变量筛选和解决诸如超饱和设计数据的p>n问题的能力,同时它的预测精度优于Lasso方法。另外,ElasticNet方法具有不需要初始值的优点。但是正如Leng,LinandWahba(2004)指出,在使用预测精度作为模型选择的准则时,ElasticNet方法对于变量选择不相合。本文的模拟研究结果同样证实了在超饱和设计中,ElasticNet方法也有相同的问题。为了克服这个缺点,我们增加了一个诸如逐步回归的冗余系数裁剪过程。通过模拟和实际数据分析,我们发现调整后的ElasticNet过程对于超饱和设计数据分析是有效的。