论文部分内容阅读
本论文主要针对函数型数据与高维数据,分别建立变系数模型和单指标模型,研究在这两种不同数据形式下如何构造模型中未知的非参数函数的渐近同时置信带,即在未知函数的整个定义区间上构造一个二维区域,使其包含整条未知函数曲线的概率渐近等于事先给定的置信水平. 首先,我们考虑的是稀疏函数型数据的变系数模型,即随时间变化的响应变量线性依赖于某些与时间独立的协变量,但回归系数表示为某个与时间有关的协变量的函数.基于样条光滑化方法,我们从数据出发给出了系数函数的渐近置信水平下的同时置信带.在对系数函数的假设检验中,所构造的置信带成为对系数函数在其整个定义区间上的整体形态进行统计推断的有力工具.我们利用数值模拟试验证实了理论结果,同时通过分析有关CD4/HIV的研究实例数据,说明如何推断HIV病毒感染者感染前的吸烟状况,感染前的CD4细胞百分数以及感染时的年龄对其感染后的CD4细胞百分比的影响,并给出相应的p-值. 其次,我们考虑的是高维数据的半参数单指标模型.在过去的二十五年中,对于单指标模型中的系数向量,许多文献都给出了其各种各样的√n阶相合估计量.利用这些相合估计量,在比较一般的假设条件下,我们证明了通过对单指标变量(即系数向量的线性组合)的一元回归所得的链接函数的核估计量具有默示有效性,即用单指标系数向量的真实值所构造的链接函数的估计量与用系数向量的√n阶相合估计量所构造的链接函数的估计量,这两个估计量之间是渐近等价的.接着,利用所得的链接函数的核估计量的默示有效性,我们构造出了链接函数的渐近同时置信带.随后的数值模拟结果验证了渐近理论结果.同时我们根据所提出的构造同时置信带的方法对波士顿房价数据进行了统计分析和假设检验.