论文部分内容阅读
在概率论与数理统计的学习过程中,我们往往需要通过数据,对于未知道的函数关系进行预测,这种预测一般可以分为两种:
一种是参数回归,包括线性参数回归和非线性参数回归.这种回归的优点是,比较简单,可以充分利用函数结构的信息,在回归的时候收敛的速度也比较快.其中,线性的参数回归已经被大多数人讨论过,也比较成熟;非线性的,虽然有一定难度,但是通过牛顿法等,可以将它化为线性的来处理,也获得了广泛的使用.但是上述两种方法还是有一定缺陷.那就是,当函数结构不明朗的时候,估计就无从下手了,这就引来了另一种方法。
另一种方法是非参数估计,它具有灵活多变,适应性强,无须了解函数的结构的优点.但是,这种方法也有一定的缺陷.首先是回归时要求的数据量比较大,收敛性的证明比较麻烦,目前人们的讨论还大多停留在数据独立随机变量的估计方面,对于相依性比较强的随机变量,还没有一个完整的结果。
本文是在硕士学习阶段完成的,包括三个部分的内容:
第一个部分,主要研究了随机变量序列{(Xi,Yi},i=1,…,n}在α混合的条件下,核估计函数方差的有界性.设{(Xi,Yi),i=1,…,n)是严平稳的随机样本序列,它们满足α混合条件.设:Yi=m(Xi)+εi,为了估计函数关系m(x),我们采用局部常数法,即:m(x)=nΣi=1YiG(x-Xi/h)/nΣi=1G(x-Xi/h),其中G(x)为核函数,h为窗宽.为了讨论m(x)的性质,我们首先引入F(x),令F(x)=nΣi=1YiG(x-Xi/h)/n,我们证明F(x)具有如下性质:var(F(x))≤Jhd/n其中J为一个常数.我们可以看到,在h→0的前提下,该方差是收敛到0的.
本文的第二个部分,主要研究了核估计的一致收敛性,目前已经有的各种研究,往往集中于x为定义域中固定一点的情景,这在应用上就受到极大的限制.我们将固定点的情形,扩展到了全体定义域的情形.同时,人们在研究一致性的时候,往往对x的范围加以限制,一般是‖x‖<M,这样取了模的上界.而在我们的讨论中,对x的范围的要求,拓展到了全体定义域上,且去掉了‖x‖<M的限制.本部分的证明方法,是将supx(F(x)-EF(x))分为4个小部分,分别证明它们为Op(hdrn),从而得出了本章的结论.而本章中使用集合A和τn,对supx(F(x)-EF(x))进行划分,是我们的主要创新.我们最后得出结论是:收敛速度为Op(hdrn)=Op(log1/2n/1+rd/2n),比逐点的收敛速度要慢一些,但是仍然是收敛的。
进一步,我们可以得出了定理2的一个推论,这个推论是非常有用的.如果我们将局部常数估计,改为局部线性估计,那么这个部分还可以进一步深入下去。
本文的第三个部分,我们证明了一个非常强的结论,是渐近正态性.证明的思路是将(m(x)-m(x))划分为Rn和Bn,其中第一部分是渐近正态的,而第二个部分是依概率收敛的,利用目前已经有的结论,我们可以得到下列结果:√nhd (m(x)-m(x)-bn)L→N(0,σ2),其中bn=O(h2)=O(n-rs)→0这部分的工作,将已有的收敛结果大大推进了一步,成为渐近正态.证明中的核心,依然是对要求证的式子进行合理的划分.在证明的过程中引入了鞅的概念.这部分还可以进一步的深入,比如利用特征函数,对渐近正态性进行研究,以及利用Liyapounov定理等。
综上所述,本文在随机变量序列为相依的前提下,得出了三个新的结论,主要使用的方法,就是对要求证的部分进行划分,分部分证明结果,本文证明的结果,对研究相依情况之下的非参数估计,是具有一定的理论和实用价值的。