论文部分内容阅读
本文在三种情型下讨论了数据缺失时回归模型反映变量均值的经验似然置信区间一. 协变量和反映变量都缺失时回归模型反映变量均值的经验似然置信区间考虑非参数回归模型(1.1)
其中X为d 维随机协变量,Y为一维反映变量, 为未知回归函数,为随机误差,且,,与X独立.在实践中,我们通常得到一组不完全的样本,其中 , .假设与相互独立,且与相互独立,此条件蕴含(MCAR)条件,即,,为常数.定义几个集合,,针对数据的不同缺失情况,我们分别给出下列补充(a) 当,不补充,(b) 当,用补充,其中为核函数,为窗宽,且当,(c)当,用补充,这样我们得到Y的完全样本为(1.2)为了避免的分母出现零,我们先做一些修正,令,,其中,且当,用修正得到Y的完全样本为(1.3)类似于Owen(1988),可得的对数经验似然比(1.4)其中满足下列方程(1.5)记为X 的概率密度函数,,假设下面的条件成立(C.f)有直到阶的有界偏导数.
(C.m)有直到阶的有界偏导数.
(C.Y) .
(C. ) .
(C.K) (I)为有有界支撑的有界核函数.
(ii) 为阶核.
(C. ) (I) .
(ii) .
(C. ) .
定理1.1 在上面的假设条件下,如果为真参数,则有(1.6)其中是自由度为1的标准变量, .
由于非标准的分布不能对作区间估计,故我们需引入调整对数经验似然比 .见(第5页)
定理1.2 在定理1.1的假设下,如果为真参数,则渐近分布.即,其中 .
二. 同模型下数据缺失时线性回归模型反映变量均值的经验似然置信区间考虑两独立总体,为上的随机向量,,假设它们都有相同的线性回归模型( 2.1)其中为维未知常向量,为随机误差,且,,与X独立.实践中,我们通常得到总体的样本为完全样本,得到总体的样本为不完全样本,其中表示全部缺失.利用总体的完全样本构造的最小二乘估计(2.2)因此,我们可以用补充 .
类似于Owen(1988),可得的对数经验似然比2.3)其中满足下列方程(2.4)定理2.1 假设,如果为真参数,则有(2.5)其中,是自由度为1的变量.
由于非标准的分布不能对作区间估计,故我们需引入调整的对数经验似然比 .见(第13页)
定理2.2 在定理2.1的假设下,如果为真参数,则渐近布,即,其中 .
三. 同模型下数据缺失时非参数回归模型反映变量均值的经验似然置信区间考虑两独立总体,为上的随机向量,,假设它们都有相同的非参数回归模型(3.1)其中为未知回归函数,为随机误差,且,,与X独立.实践中,我们通常得到总体的样本为完全样本,得到总体的样本为不完全样本,其中表示全部缺失,利用总体的完全样本构造的估计(3.2)其中为核函数,为窗宽,且当,,因此,可以用补充 .
类似于Owen(1988),可得的对数经验似然比(3.3)其中满足下列方程(3.4)假设下面的条件成立(1)为二次可微的对称密度函数.
(2) .
(3) .
(4)的一阶和二阶导数都存在并且都是连续有界函数.
(5)和有共同的紧支撑,都有二次连续可微密度函数,且 .
(6) .
定理3.1 在上面的假设条件下,如果为真参数,则有(3.5)其中,是自由度为1的标准变量.
由于非标准的分布不能对作区间估计,故我们需引入调整的对数经验似然比 .见(第20页)
定理3.2 在定理3.1 的假设下,如果为真参数,则渐近分布,即,其中 。