论文部分内容阅读
随着统计建模思想不断深入到社会生活各个方面,所考虑的模型选择问题的维数可能会很高.在处理高维数据时,统计学家已提出多种惩罚方法来进行模型选择和参数估计,例如LASSO,MCP,SCAD等方法.这些方法在一定的条件下具有渐近神喻性,但没有对选择结果提出一种合理的误差评定方法. 本文着重研究了高维数据在直接控制FDR下的模型选择问题,并提出了一种我们称之为Semi-MCP的模型选择方法.Semi-MCP方法的基本思路是:首先用MCP方法选择模型S,然后将待检验的第j个变量添加到所选择的模型S中,在新模型S∪{j}中考虑变量的假设检验问题,进而可以评估选择错误,并在控制FDR下建立选择变量系数的置信区间. 本文也验证了Semi-MCP估计在一定条件下几乎是理想的并且具有粘性性质.通过模拟数据分析,其结果说明Semi-MCP方法是一种比较好的高维模型选择方法.