论文部分内容阅读
半参数模型是二十世纪八十年代发展起来的一种重要的统计模型,它引入了表示模型误差或其它系统误差的非参数分量,从而使模型既含有参数分量,又含有非参数分量,兼顾了参数模型和非参数模型的优点,比单纯的参数模型或非参数模型有更大的适应性,并具有更强的解释能力,因而在实际中有着更为广阔的实用背景。随着半参数模型在理论和方法上的日益成熟,对经济、医药、工农业生产等方向将起着更重要的促进作用。
但在一些实际问题中,如市场调查、民意调查、医药研究等领域产生了大量的不完全数据,其中相当一部分数据为缺失数据。不完全数据给数据的使用和分析带来了很大困难,也是造成信息系统不确定的主要原因之一。在有数据缺失的情况下,通常的统计方法不能直接应用,需要对数据进行必要的处理,常常需要对不完全样本中的缺失值进行填补,继而得到“完全样本”,再按通常的统计方法进行推断。缺失数据情形的统计推断已成为当今统计界的一个热门研究领域。因此研究缺失数据下的半参数模型有重要的现实意义。
本文主要在响应变量随机缺失的情况下,且满足随机MAR 缺失机制情形,用最小二乘估计法研究了填补前和填补后半参数回归模型和半参数EV模型中参数分量和非参数分量的估计及其大样本性质。
第二章,对响应变量随机缺失的半参数回归模型,先利用观察到的的完全样本单元,综合核估计和最小二乘估计法构造出模型中参数分量β和非参数分量g(·)的估计量^βn(1)和^gn(1)(·),并基于^βn(1)构造误差方差σ2的估计量^σ2n,再利用随机填补法对缺失的响应变量进行填补,利用填补后的“完全数据”,再对β和g(·) 进行二次估计,得到相应的二次估计量^βn(2)和^g(2)n (·),在适当条件下研究了估计量^βn(1),^σn2,^βn(2)的渐近正态性和^g(1)n (·),^g(2)n (·)的最优弱收敛速度。
第三章,在半参数EV模型中响应变量随机缺失的情况下,用观察到的完全数据单元,综合核估计和偏最小二乘估计法构造出模型中参数分量β和非参数分量g(·)的估计量^βn 和^g*n(·),在一定条件下研究了^βn的渐近正态性和^g*n(·)的最优弱收敛速度。
本文特色:
1. 本文首次使用随机填补后的“完全数据”对半参数回归模型中的参数分量和非参数分量进行了二次估计,并在适当条件下研究了估计量^βn(1),^σ2n, ^βn(2)的渐近正态性和^g(1)n (·),^g(2)n (·)的最优弱收敛速度。
2. 综合核估计和偏最小二乘估计构造出了缺失数据下半参数EV模型中参数和非参数分量的估计量,并给出了估计量^βn的渐近正态性和^g*n(·)的最优弱收敛速度。