论文部分内容阅读
面板数据模型是当前经济及统计学界使用最广泛的模型之一,本论文在贝叶斯框架下分别探讨了含随机效应面板数据的均值回归和分位回归模型中参数估计与变量选择问题。全文共建立了四种模型,包括面板数据的贝叶斯均值回归模型、贝叶斯正则化均值回归模型、非参数贝叶斯分位回归模型、贝叶斯正则化分位回归模型。全面探讨了这四种模型下参数估计,重要解释变量选择等问题。并在不同先验和随机误差分布假设下,构造了六种抽样算法,且分别在理论、模拟和实际数据分析三个方面进行了论证与分析,主要成果有:首先,对于面板数据的贝叶斯均值回归模型,假设误差项和个体效应均服从正态分布,回归系数有正态先验,其它参数取无信息先验的条件下推导出了各个参数的后验分布,由于后验分布都来自常见分布,从而提出了参数估计的Gibbs抽样算法。通过计算机模拟研究,将本文提出的方法与已有常用估计方法进行了比较。最后,利用本节的方法对美国工资调查实际数据进行了均值回归建模分析。其次,对于面板数据模的贝叶斯正则化均值回归模型,本论文从贝叶斯惩罚也即贝叶斯正则化的角度探讨了回归模型中重要解释变量挑选问题。通过假设回归系数先验为拉普拉斯分布来代替正态先验,构造了与Lasso估计相等价的面板数据贝叶斯Lasso估计,并给出了相应的MH抽样算法。考虑到MH算法中提议分布不易选取,本文利用积分恒等式构造了更易于实施的Gibbs抽样算法。由于不同的解释变量在回归中所处的地位和作用是不同的,施加相同的惩罚系数对重要解释变量会产生较大偏差,本文对贝叶斯Lasso估计进行了改进,提出了与Adaptive Lasso相等价的贝叶斯Adaptive Lasso估计。该估计可以自动捕捉解释变量信息,并自动采取不同的惩罚系数。在不同模型下,通过计算机模拟数据,本文将一般的Lasso惩罚法、Adaptive Lasso惩罚法与本文所提出的两种贝叶斯惩罚法进行了比较。结采品示两种贝叶斯惩罚法要优于一般Lasso和Adaptive Lasso惩罚法。最后,利用本节两种贝叶斯正则化方法对考虑交互效应的美国工资调查数据进行了参数估计和变量选择。再次,对于面板数据的非参数贝叶斯分位回归模型,通过对随机误差放宽假设条件,即仅在分位数为0的约束之下,引入一种双层有限混合正态分布,混合比例参数采用广泛灵活的Stick-Breaking先验,使其更能够获取复杂数据的分布信息。通过引入双层潜变量将较为复杂的似然函数进行重构,极大减小了计算负担。根据推导出的各待估参数条件后验分布,提出参数估计的Gibbs抽样算法。当数据分布信息较为复杂时,非参数贝叶斯分位回归比参数分位回归更具有优势,灵活性更强。通过五种不同的数据生产模型,在不同的随机误差下进行了模拟,将非参数贝叶斯分位回归同参数贝叶斯分位回归等方法在中位点和极端分位点进行了比较。最后,利用贝叶斯分位回归方法对美国工资调查数据在多个分位点处进行了建模分析。最后,对于基于贝叶斯正则化的面板数据分位回归模型,在假设响应变量为非对称拉普拉斯分布基础上,对其进行分解,构造了常见分布假设下的贝叶斯分层分位回归模型,解决了非对称拉普拉斯分布无共轭先验给抽样算法设计带来的困难。通过对回归系数假设合适的先验信息分别构造了与Lasso和Adaptive Lasso相等价的贝叶斯正则化分位回归估计。利用积分恒等式和辅助变量引入,构造了参数估计的切片Gibbs抽样算法。然后通过模拟仿真数据将普通分位回归、Lasso分位回归、贝叶斯分位回归和本文提出的两种贝叶斯正则化分位回归方法进行了比较。还将本文提出的6种方法在运行时间和计算速度上进行了展示与比较。最后,利用两种贝叶斯正则化分位回归方法对考虑交互效应的美国工资调查数据在多个分位点处进行了参数估计与模型选择。在本文最后,还对本文提出的各种方法优缺点及应用前提进行了总结,提出了进一步可研究的工作和方向。