论文部分内容阅读
变系数回归模型是线性回归模型的一种推广,它在具有线性回归模型便于解释的优点的同时具有非参数回归模型的灵活性,并且避免了纯粹的非参数回归模型具有的“维数祸根”等缺点。自上世纪九十年代提出以后广受经济、金融、生物等领域的关注。到目前为止,学术界对变系数模型已经有了较为深入的研究及应用,但是仍存在一定的不足,特别是在误差项的分析上存在一定的欠缺。此前,研究者普遍进行误差项相互独立的前期假设,然后通过多项式样条或局部多项式方法对模型进行统计推断和分析。但是在实际问题当中,特别是在时间序列数据的处理过程中,误差项往往存在一定的自相关关系,相互独立的假设较难成立,传统方法存在一定局限性和不稳定性。
本文主要研究当误差序列存在自相关关系,特别是一个自回归过程时,变系数回归模型的统计推断问题。主要步骤分为五步:第一,在忽略误差结构的情况下使用多项式样条估计的方法估计模型残差,同时对模型最小二乘估计量的大样本性质进行讨论,得到估计量的偏度以及渐近正态性。第二,应用SCAD惩罚函数结合Yule-Walker方程的方法对第一步估计出的残差进行处理,拟合自回归误差过程。该方法能同时确定自回归过程的阶数和有效估计自回归过程的相应系数。并且估计结果具有Oracle性质,即在大样本情况下,由该方法得到的自回归过程阶数等于真实阶数,自回归误差系数的估计与自回归误差阶数完全已知时得到的估计是完全等价的。第三,根据拟合的自回归误差结构,进一步提出了可行广义最小二乘估计的方法,即用估计出的残差结构对原模型残差的协方差矩阵进行估计,然后通过加权处理的方法,得出相应可行广义最小二乘估计量。我们证明了在大样本情况下,可行最小二乘估计量比忽略自回归误差结构的估计量更为有效,即在偏度不变的情况下,存在更小的渐近方差。第四,通过数值模拟的方法对我们的理论结果进行验证。数值模拟包括四个部分:SCAD方法有效性的验证,单变量AR(1)误差模型,单变量AR(2)误差模型以及双变量AR(2)误差模型。模拟结果显示当时间序列不存在自相关关系时,由SCAD方法确定的变量阶数的正确率为75%左右,当时间序列存在1阶自相关关系时,由SCAD方法确定的变量阶数的正确率稳定在为80%以上。同时三个模型的模拟结果,均呈现最好广义最小二乘方法最好,可行广义最小二乘方法次之,普通最小二乘方法相对较差的情况;并且,在样本量增大的情况下各种估计量的有效性均有所提高。模拟结果基本符合我们之前的理论预期。第五,我们将得到的理论结果应用于两个实际问题的分析,第一个问题是对罗羡华、杨振海以及周勇在《时变弹性系数生产函数的非参数估计》一文中建立的以我国的资本产出弹性和劳动力产出弹性为时变系数的变系数模型进行分析。与原文中采用的局部多项式的估计方法不同。我们使用改进方法对此模型进行分析,发现研究对象本身误差结构确实不存在自相关关系,并且分析结果与原文中基本一致。第二个问题是对大豆期货价格的影响因素进行分析,影响因素包括美国大豆进口价格、豆粕期货价格以及豆油期货。通过SCAD方法,我们发现该变系数模型本身误差结构存在一阶自相关关系,相关系数为0.8890。并且,可行广义最小二乘估计较普通最小二乘估计逐点方差更小,置信带更窄,即估计量更为有效;同时估计结果更贴合客观实际。
但本文尚存在如下问题:在分析过程中,对多项式节点的讨论较少,在不同系数的分析中使用了相同的时间节点进行估计;采用的非参数估计方法比较单一,如果能够使用更多的估计方法,进行相应的横向对比,可以更好的支持所得结论。