论文部分内容阅读
现实世界的观测数据呈现多样化特征,当观测数据表现出函数特征或者为一条条曲线时,这种数据称为函数性数据。本文研究的重点是这样的观测数据:响应变量观测数据是离散性数据,而解释变量观测数据包含离散性数据和函数性数据。对这种数据进行分析的一种可行方法是建立函数性广义线性模型。 函数性广义线性模型也涉及到变量选择的问题,不过这时不仅要选择普通变量同时也要选择函数性变量,即一条条曲线,称这种选择为曲线选择。进行函数性广义线性模型曲线选择的一种可行方法是正则化方法,即通过对目标函数加入惩罚项来达到变量选择的目的。 本文通过研究发现,函数性广义线性模型曲线选择问题具有群组效应,同时可能存在高维数据性质。同时本文通过数据模拟,推荐使用Group Bridge、Group MCP和Elastic Net。 本文的内容和创新之处在于:第一,对函数性广义线性模型曲线选择问题进行了详细讨论和研究,提出了适合曲线选择的正则化方法;第二,通过模拟数据,对各种正则化方法进行了比较研究,同时也对各种正则化方法的性质进行了验证,结果发现,对于函数性广义线性模型的曲线选择问题,除了能够识别群组效应的正则化方法具有很好的数值效果外,不能识别群组效应的正则化方法,例如Lasso、 MCP、SCAD,也表现出较好的数值结果。