论文部分内容阅读
参数假设检验和模型选择是统计学中非常重要的研究内容,两者均能降低模型的误设风险、减少模型复杂性并提高模型的预测精度,具有重要的理论和应用价值,近年来取得了广泛应用和快速发展.本文主要基于半参数模型研究了上述两个方面,尤其是对于后者的研究.具体而言,本文研究了以下五个问题.在第二章中,针对响应变量缺失和协变量含有测量误差的情形,在部分线性变系数模型下研究了线性部分参数的假设检验问题.首先,考虑了当参数满足线性约束条件时参数和非参数系数函数的约束估计,然后,分别基于Lagrange乘子方法和修正的残差平方和方法提出了检验约束条件是否成立的统计量,在零假设下证明了两种检验方法具有等价性,即两种检验统计量不仅具有相同的卡方极限分布,而且在大小上精确相等,最后,通过数值模拟和实际数据分析验证了这两种检验方法的正确性.在第三章中,针对上一章所考虑的缺失响应半变系数EV模型,结合自适应Lasso和SCAD惩罚函数研究了模型线性参数部分的变量选择问题,提出了自适应Lasso估计和SCAD估计,在一些常规条件下建立了估计的相合性及哲人性质,另外还讨论了估计的求解算法、标准误差的计算公式以及调节参数的选取准则,最后,通过数值模拟验证了本章提出的估计方法的可行性和有效性.在第四章中,针对观测数据非独立同分布的情形,在部分线性时变系数模型下,当线性部分变量含有测量误差时,结合SCAD惩罚研究了模型参数部分的变量选择问题,当真实的变量序列满足?混合条件时,证明了模型线性部分的参数估计仍然具有相合性和哲人性质,此外,还从理论上讨论了基于惩罚的模型参数的假设检验问题,提出了惩罚最小二乘检验统计量,在零假设下证明了该统计量的极限分布不再是常规的卡方分布,即Wilks现象不再成立.最后,通过数值模拟和实际数据分析验证了变量选择方法的有效性.在第五章中,针对协变量个数有可能发散的情形,在最小绝对相对误差(LARE)损失函数下,研究了乘积模型的变量选择问题.通过求解一般形式的1L加权惩罚问题,获得了参数估计,在一定条件下,本章从理论上证明了使得估计相合性成立的维数最高可达到1/2()np?o n,而保证哲人性质的维数最高可达到1/3()np?o n,此外,还提出了一种快速实用的变量选择过程,该方法不仅同样具有上述理论性质,而且更易于求解和计算.通过数值模拟结果发现提出的实用变量选择方法比LAD方法精度更高.在第六章中,针对实际中可能出现响应变量为Bernoulli变量且协变量个数远远大于样本量的情形,在广义变系数模型的框架下研究了超高维的变量筛选问题.分别提出了基于边际极大似然估计和边际似然比统计量的变量筛选方法,并在一定条件下,建立了变量筛选的相合性和排序相合性.此外,为了进一步精炼筛选过程,本章还提出了迭代筛选和贪婪筛选的两种算法,数值结果显示提出的方法比基于参数模型的方法效果更好.本章可以作为Fan和Song(2010)和Fan等(2014)中方法和结论的进一步推广.