Identification,Estimation and Application of Semiparametric Models

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:talisa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的参数估计方法由于在应用方面的不足,主要是对模型施加形如总体分布和回归函数等过强的假设,导致估计结果可能产生过大的误差,得到一个不稳健的结果。在过去几十年里,越来越多学者对非参数模型进行了广泛的研究。相比于传统的参数方法,非参数方法不需要对模型做出诸如线性或可以转化为线性的设定,同时也不需要对模型中的误差项做过多的分布假设,这样非参数方法可以根据数据的实际情况,提供一个更为稳健和准确的估计结果。当然,如果已经提前知道模型的函数形式,传统的参数方法无疑能够展现出比较明显的优势。然而,在实际应用中,模型的具体形式难以知晓。此外,对模型错误设定造成的误差是难以估量的。  非参数方法也存在其自身的不足,估计量的收敛速度与模型中变量的数量成反比。也就是说,随着模型中变量的增加,估计量的收敛速度急速下降,出现了维数灾难(curse of dimension)。这样,半参数方法变得流行起来,相比于非参数方法,一方面半参数方法将我们的注意力集中到所需要考察的变量,即将一部分变量设定为线性而其余部分设为未知的函数形式;另一方面,半参数方法可以减少维数灾难的出现。本文主要研究了三种半参数或者可以转化为半参数的模型:第一章研究带乘法形式异方差和删失(censored)下的部分线性模型;第二章研究带删失的变系数变换模型;第三章研究带内生处理和删失的平均处理效应模型。  第一章,我们研究了Chen and Khan(2001)中的带删失的部分线性模型。基于条件分位数的假设,在异方差的情形下,Chen and Khan(2001)提出了一个两步估计量。本章在对异方差的形式做出乘积性的设定后,即:将误差项设定为关于自变量未知函数与一个同方差的随机变量的乘积,提出了一种不需要误差项均值为零或者中位数(任意分位数)为零假设的估计方法。这样,本章提出的估计方法估计了如下模型:Y=max(Y*,0),Y*=Xβ0+m(Z)+U,U=σ(X,Z)(∈),其中,m(·)和σ(·,·)的函数形式未知,β0为线性部分的系数。从模型的形式可以看出,因变量被截尾,只能观测到大于零的部分样本。我们证明了在这个模型中,在满足σ(·,·)充分非线性的条件下,我们的估计方法能够准确地估计出β0和m(·)。  我们的估计量是一个两步估计量:第一步通过局部多项式的方法估计出条件分位数;第二步利用第一步的估计结果,采用加权的最小二乘法,估计出相应参数。我们证明,在大样本情况下,β0的估计量是无偏的、一致的,也是以√n的速度收敛的;m(·)的估计量是一致的,以非参数的速度收敛。此外,我们的方法可以推广到随机删失(random censoring)的情形,与固定删失不同的是,第一步采用Kong et al.(2013)的加权局部多项式分位数估计方法。  蒙特卡洛模拟的结果表明,我们的估计量表现良好,存在略微的下偏。在异方差为乘积形式时,我们的估计量表现优于Chen and Khan(2001)的中位数方法。即使异方差函数不满足识别条件,我们的估计量表现依旧良好,但略微比Chen and Khan(2001)的方法差。随机删失情形下,估计量的表现与固定删失情况下的表现类似。在实证应用部分,我们研究了中国226家上市的化工企业股权集中与销售净利率的关系。估计结果表明,股权集中与销售净利率负相关,原因可能是控股大股东侵害中小股东利益,影响了公司的绩效也降低了员工工作的积极性。  本章内容的主要贡献在于,在一般的乘积性异方差的设定下,给出了一个不需要误差项零均值或者零分位数的假定、一致而且√n收敛的估计量。同时,将此推广到随机删失的情形。  第二章,我们考察了如下带删失的变系数变换模型,Y=(c)I(Y*≤(c))+Y*I((c)<Y*<(c))+(c)I(Y*≥(c)),H(Y*)=Xβ0+Zg(W)-U其中,-∞≤(c)<c<(c)≤+∞,g(·)的函数未知,H(·)为未知单调递增的变换函数。在误差项U的条件Τ分位数为零的假设下,与Zhang(2014)相似,采用Chen(2010)积分形式的局部最大得分法,给出了β0和g(·)的估计。为了实现β0的√n收敛,利用Lee(2003)的平均分位数回归(AQR)思想,构造了β0的一个两阶段√n收敛的估计量。β0和g(·)仅仅表示了自变量与变换后因变量的偏效应,我们有必要考察自变量与因变量之间偏效应。类似地,在不知道H(·)和H-1(·)估计量的情况下,我们构造了与Zhang(2014)相似的偏效应估计量。  本章的估计过程如下,对给定c∈((c),(c)),记D(c)=I(Y>c),由于H(·)单调递增,D(c)=I(Y>c)=I(Y*>c)=I(Xβ0+Zg(W)-H(c)>U)在误差项U的条件Τ分位数为零的假设下,我们有E(D(c)|X,Z,W)-Τ=>0(←→)Xβ0+Zg(W)-H(c)>0有了上述等式,利用Chen(2010)中积分形式的局部最大得分法,通过最大化如下函数,得到(β0,g(w),H(c))的初步估计,即∫1/nhdw2n∑i=1(Di(c)-Τ)K1(Xiβ+Ziη-(H)n(c,w,β,η)/h1)k2(Wi-w/h2)ω(c)dc其中,(H)n(c,w,β,η)=arg maxα1/nhdw2n∑i=1(Di(c)-Τ)K1(Xiβ+Ziη-a/h1)k2(Wi-w/h2)事实上,上述方法得到β0的估计量的收敛速度低于√n,为了得到其√n的估计量,我们采用Lee(2003)的AQR方法,得到一个加权估计量。  在满足本章假设时,我们证明了上述方法得到的β0的估计量是无偏、一致以及√n收敛的;g(·)的估计量是一致的,以非参数的速度收敛。同样地,上述方法可以扩展到随机删失的情形。蒙特卡洛模拟结果表明,我们估计量的表现良好。其中,β0的估计量存在略微的上偏;对函数g(·)估计量同样表现良好,g(·)估计量的图像与实际情况相符。对于随机删失的情形而言,β0估计量表现略差,但在可接受范围内。同样,g(·)估计量的图像效果一般,与实际情况也比较相符。在实证部分,我们再次考察了第一章中分析的股权集中与销售净利率的关系,不同的是,我们将股权集中这一变量的系数设定为关于企业资产的函数。估计结果表明,股权集中与销售净利率同样呈负相关,股权集中的偏效应随企业资产的变化而变化。我们本章研究的模型能够更灵活地估计非常数的偏效应。  本章的主要贡献在于,在分位数框架下,估计变系数的变换模型,而不需要对误差项分布做出参数假设,而且将此推广的随机删失的情形。同时,给出了自变量与因变量之间的偏效应。  第三章,我们研究了二元处理变量或者政策变量对因变量的影响。本章试图在分位数的框架下,估计了一个带内生处理、异方差和删失的处理效应模型,并给出了一个计算相对简便的处理效应的估计量。其中,模型中将受到处理和未受到处理的因变量均设定为解释变量的线性函数,异方差为关于解释变量和其他外生变量的未知函数与同方差随机变量的乘积。因而,只需估计出在不同情形下解释变量的系数,再用二者之差乘以对应的解释变量,我们便得到了处理效应的估计值。相比于已有文献,本章所采用的方法有几个优点:(1)能够处理带删失的因变量、内生的处理变量以及允许乘积性的异方差形式,当然此方法在同方差的情形下依然适用;(2)不同于已有文献,不需要对误差项做参数设定或者做出Rosenbaum and Rubin(1983)的处理条件独立假定。(3)本章将原有模型简化为部分线性变系数模型,给出了一个计算简单的估计量。  本章识别上述模型方法的关键在于将原处理线性模型简化为部分线性变系数模型,在引理3.2.1下,即给定解释变量后,误差项的Τ分位数仅与倾向得分和处理变量有关,利用第一章中所用的配对相减法,可以将因变量的Τ分位数写成部分线性变系数模型。这样,只需估计简化后的部分线性变系数模型即可。  根据上述模型的识别方法,本章模型的估计量是一个多阶段的估计量。首先,通过非参数估计的方法估计出倾向得分。其次,利用局部多项式回归的方法估计出因变量的条件Τ分位数。再次,在倾向得分的局部范围内,采用局部加权的最小二乘法可以得到线性系数的初步估计值。最后,通过Lee(2003)的方法,得到线性系数的加权估计量。在满足本章中假设的条件下,我们证明了该估计量的大样本性质,该估计量是无偏、一致以及√n收敛的。  蒙特卡洛模拟的结果表明,我们的估计量表现良好,呈现出略微的上偏。在实证部分,我们利用本章的模型估计了教育培训对收入的影响。回归结果表明,本章中估计方法得到的估计值显著小于最小二乘法和倾向得分法的估计值。值得说明的是,最小二乘法得到的估计值和倾向得分法得到的估计值相差不大。这说明,在估计教育培训对收入的影响时,处理条件独立假定可能过于严苛,而本章的估计方法则提供了一个较为可信的估计结果。  本章的主要贡献在于,放松了以往倾向得分方法的处理条件独立假定,从分位数框架内找到了一个估计带删失、内生处理变量以及乘积性的异方差的处理效应模型的方法。
其他文献
我国的人寿保险业在经历了二十一年的业务中断后,随着经济体制改革的深化和对外开放政策的落实,近20年来得到了飞速的发展,但我国的寿险业总体来说还是一个幼稚产业。同时,我国的
中国加入WTO后将按照市场准入和国民待遇原则,逐步开放国内金融业市场,对外资银行经营区域、经营范围等的限制将会取消,在这种日益开放的情况下,原有的税收制度和政策已不再
该文一共分为四个部分,在第一部分绪论中,主要是对国内外的研究现状作了一定的总结和介绍,并对后文分析需要用到的理论作了简单回顾,并且为了行文需要,笔者将文章的创新之处
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
该文从中国的农产品商品风险谈起,指出在中国当前经济中存在着严重的商品风险,随后,对利用衍生工具管理农产品商品风险的各种工具进行了分析比较,指出利用农产品期货期权管理
从中国现实的经济状况来看,诸多的制约条件使中国难以在短时间内达到较高的社会保障水平.一方面,国民收入不高,生产力水平不发达,现有的社会保障基础较差,全面实现基本保障水
目的提出织纹螺中河豚毒素的限量建议值,为日常监控提供判定依据。方法对织纹螺中河豚毒素的来源、含量情况、毒性、检测标准以及国内外有关河豚毒素、麻痹性贝类毒素的规定
多元失效时间数据经常出现在生物、医学、社会和经济学等研究领域中.例如,在流行病学队列研究中,以家庭为单位记录疾病发生的时间;临床医学中,单个个体可能经历几种不同类型的疾
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
全文共分四章.第一章是商业银行风险管理的一般理论.该章主要从商业银行风险管理的基础理论出发,对商业银行风险管理的一般理论加以阐述,为论文接下来的进一步论述,奠定了理