论文部分内容阅读
非参数回归很长时间以来都深受关注,人们提出了许多解决该问题的方法。在这些非参数回归理论中,Nadaraya-Watson核估计和局部多项式回归很受重视。其中,Nadaraya-Watson核估计是许多核回归方法的基础,而局部多项式回归能够有效降低回归函数估计的边界偏倚。虽然非参数回归对异常点的敏感程度较之参数回归通常更低一些,但研究有关因素(如:数据点)对回归函数估计的影响仍然是必要的。本论文提出一个方法,研究基于高斯核函数的Nadaraya-Watson核估计和局部多项式回归的局部影响分析。由于在这两种非参数回归方法中局部平滑技术都起到了非常重要的作用,本文在方法设计中,不仅考虑了数据点的影响评价,也考虑了自变量值接近的数据点形成的数据组的影响评价。为了避免强影响点或数据组之间的掩盖效应,文中方法构建于数据点或数据组的联合扰动模式下。上述两种非参数回归方法无一基于似然函数,且推断结果均非向量而是函数。因此,使用似然位移的方法或针对向量型推断结果的方法,如基于广义影响函数的方法,均不适用于这两种非参数回归的局部影响分析。文中提出的方法基于一个回归位移函数,该函数以扰动向量为自变量,刻画扰动前后回归函数估计的变化,可视为似然位移的思路在非参数回归问题中的推广。在似然位移函数下定义的诸概念,如影响图、扰动方向、升截线、法曲率、最大影响方向、影响总计向量等,均可推广到回归位移函数下。在基于回归位移函数的理论框架中,最大影响方向和影响总计向量仍被用作影响度量统计量。本文在Nadaraya-Watson核估计下和局部线性回归下(作为局部多项式回归下的示例),均导出了升截线法曲率的具体表达式,且说明了它们都是扰动向量的二次型。如此,则最大影响方向和影响总计向量都可以从上述表达式中轻易获得。本文使用了扰动向量的张量矩阵进行扰动选择,包括扰动的恰当程度的度量和必要时扰动的调整。假定数据点是独立同分布的,则在数据点的联合加权扰动模式下,原始的加权扰动向量是恰当的,而在数据组的联合加权扰动模式下,若各组所含数据点个数有所不同,则加权扰动向量需要进行调整。文中进行了数据模拟研究,用于说明所提方法。