论文部分内容阅读
线性模型作为现代统计学中的一个重要分支,在工商管理、经济、医学、生物、农业、地质、气象、社会等领域应用非常广泛。其中,参数估计是线性模型中十分重要的研究领域。19世纪初,Gauss提出的最小二乘估计被证明是最佳线性无偏估计,然而当自变量间出现多重复共线性现象时,最小二乘估计开始变得不可信赖。为了改进最小二乘估计,James和Stein于19世纪60年代提出了压缩估计,此后越来越多的统计学者加入到有偏估计的研究中,取得很多有影响的成果,使得参数估计的发展不断完善。本文针对线性模型有偏估计进行研究,介绍总结了已有的有偏估计,并提出有偏估计的新算法。全文共分为五章:第一、二章是绪论和预备知识,分别介绍了线性模型有偏估计的实际背景和研究现状,以及与本文有关的基础理论与相关知识,如最小二乘理论、常见有偏估计、高斯消去变换思想、岭迹法选取岭参数以及复共线性带来的影响和诊断方法等。第三、四章则提出了有偏估计的新算法,并通过试验模拟和实际分析来评估新算法的效果。第五章则是对全文的总结,并指出有待解决的问题。第三章是文章的核心和重点。首先,对病态矩阵作高斯消去变换,发现当矩阵病态性出现时,主元总会变得很小。借鉴岭估计增大所有对角元素的思想,产生了增大相应主元再做高斯消去变换的灵感。而要实现新算法,关键还在于主元的选择和主元增量的选择。文中提出了两种选择原则,进而提出了两种不同的方法。第四章对提出的两种新方法分别进行数据模拟实验,最后通过平均残差平方和以及平均预测残差平方和的箱线图来对比两种新算法和最小二乘估计及岭估计的优良性,并用新方法2对身体脂肪实例进行了分析。通过实验模拟和实例分析,发现在复共线性较大时,新方法1预测效果优于岭估计,而新方法2相较于岭估计,则是提高了估计的无偏性。第五章总结全文,指出两种算法的局限性以及有待解决的问题,如新方法1适用于样本量较大,以预测效果为目标的实际情况。同时由于岭迹法的自身局限性,使得新方法2在实际的操作中存在一定的人为性。