论文部分内容阅读
近些年来,随着信息技术的快速发展、统计软件的不断更新,使得我们能够在统计分析中收集、存储这类型的数据,时间点取值非常密集,数据往往会显现出一定的函数特征,而这种数据会随着空间或时间的变化而发生变化,直观上,我们将这种类型的数据称作函数型数据。函数型数据被广泛应用到不同领域,如犯罪学、生物统计学、计量经济学、考古学、环境计量学、医学、神经生物学等。对函数型线性模型进行参数估计时,多数情况下是采用均值模型,但均值模型有自己的局限性,它仅仅是描述了总体的平均特征,不能够很灵敏地捕获每个变量的具体变化情况。分位数回归的概念被提出之后,分位数回归弥补了均值模型在这方面的缺点,它不但能反映变量在分布的中心特征,还能够反映变量在边际分布的特征。而在解决实际问题时,分位点的选择往往是令人为难的。因此同时考虑多个分位点的话,就可以很好的避免这个问题,所以复合分位回归就应运而生。此外,随着科学技术的飞速发展,可获得的数据信息越来越详细,且具有很高的维度,若直接利用他们来建模,则会使预测效果很差。于是,变量选择在统计建模过程中就显得尤为重要,选择合适的变量不仅能够构造结构简明、预测准确、含义明确的稳健模型。本文主要将分位数回归、复合分位数回归方法分别应用到函数型部分线性变系数模型中,并利用稀疏Group LASSO方法达到变量选择目的,提高模型的解释能力和估计精度。并且在特定的假设条件下,证明参数估计的大样本性质。最后,通过数据模拟和实证分析对所提出的模型估计方法进行验证。主要内容具体如下所述:首先简单概述本文的研究背景及意义。根据已有的国内外相关文献,对函数型部分线性模型、分位数回归、复合分位数回归及变量选择进行系统的介绍。然后,将分位数回归和复合分位数回归方法用来研究函数型部分线性变系数模型的参数估计问题。在本文的第三、四章分别给出了基于分位数回归和复合分位数回归构造估计函数型部分线性变系数模型的目标函数,并给出本文的估计方法;又在各自给定的假定条件下,得到估计参数的大样本性质,并给出理论证明。第四章中,对于复合分位数回归利用稀疏Group LASSO方法,同时进行了参数估计和变量选择,以此来提高模型的估计精度。对于第三、四章分别得到的理论结果,本文设计了多种情况的数值模拟组合来进行验证和比较,根据给出的数值模拟结果,检验了模型的合理性以及估计方法的可行性。最后,采用本文所提出的函数型部分线性变系数模型对Tecator数据进行分析,用来探究脂肪含量与水份含量,蛋白质含量以及吸收谱之间的关系,并对脂肪含量进行预测。