论文部分内容阅读
变量选择是统计推断中的经典和热门研究课题。例如在癌症疾病研究中,真正决定癌症疾病发生的基因只有数十个,从成千上万的基因中选出这具有决定性作用的数十个基因,就是一个变量选择的过程,这不仅可以帮助生物学家更好的理解和研究分子的性能,也可以帮助统计学家建立更好的分类准则。另外在现实生活中,我们要处理很多类型的数据是非负的,比如研究公司的收入、生存时间等,用传统的线性模型来直接建模就不太合理了。乘积模型则能更好的处理这类数据,因此近年来得到了广泛的应用。 本文主要研究了乘积模型的参数估计和变量选择问题。第1节综合介绍了一些传统的参数估计方法,例如最小二乘方法、最小绝对值方法,最小相对误差方法等。我们通常所用的相对误差是误差值与观测值之比,而不是误差值与预测值之比,而本文所采用的LARE准则是将以上两种形式的相对误差相加。本文第二节综述了变量选择相关方法。在回顾Chen et al.(2010)提出的LARE估计及其理论性质基础上,本文在第三节重点研究了基于LARE准则的变量选择,通过选用Adaptive lasso和SCAD两种惩罚函数得到稀疏的估计,并证明了相应估计的oracle性质。第4节给出了调节参数的BIC选取方法,并通过模拟说明所提方法的有限样本表现。从模拟效果中可以看出,Adaptive lasso和SCAD选出真实模型的概率随着样本量增加趋于1,而且估计的效率与已知真实模型下估计的效率渐近相等。本文最后给出了相关工作的推广和拓展。