论文部分内容阅读
线性模型足数理统计学中很重要的分支之一.关于它的参数估计问题成为重要的一个研究课题.研究参数的同变估计实际是来源于一个基本的思想,当我们由于某种原因改变某些量的单位或参照点时,相应的量就会在数值上发生相应的改变.这时问题中参数的估计量足否也会保持一致呢?一个“好的”估计应该保持一致.即,参数不变时,估计量跟着不变.参数改变时,估计量也有一致的改变.参数的同变估计问题之一就是研究某种意义下最优的同变估计.这是本文要研究的一个主要问题.
考虑一一般的多元线性模型
{Yn×m=Xn×pθp×m+En×m(1.3)
(E)~N(0,∑()V),∑≥0,V≥0这里X表示秩为p的已知设计矩阵;θ为未知的参数阵,称之为回归系数;∑≥0为非零非负定的参数矩阵;而参数矩阵V≥0足在非负定矩阵构成的一个子集γ中变化并且γ中的矩阵的列空间保持不变.记T=V+XX’.对于给定的V0∈γ,记T0=V0+XX’,(θ)=(X’T+X)-1X’T十Y,PX=(X’T+X)-1X’T.
本文考虑在矩阵平衡损失下,在多元线性模型中回归系数θ存在一致最小风险同变(UMRE)估计(在仿射变换群和转移变换群下)的充要条件.证明了如下的定理:
定理3.2.1.在模型(1.3)和平衡损失(1.7)下,假定V0∈γ且对任一V∈γ有μ(V0)=μ(V).则下列三个论断等价:
(a)存在θ的UMRE估计.
(b)(θ)是θ的UMRE估计.
(c)对一切V∈γ有: (X’T0+X)-1X’T0+V[In-X(X’T0+X)-1X’T0+]=0.
对于总体均值的估计,一般都是用样本均值.但是,样本均值有一个缺点,就是对异常值比较敏感.而在实际问题中由于各种原因,样本中难免会存在异常值.为了在保持样本均值的优点的同时,改善它的缺点,人们采用截尾均值.直观上可以预见,如果异常值与“正常值”差异不大,截尾均值应该不会比样本均值好.如果异常值与“正常值”差异很大,截尾均值应该会比样本均值好.临界点是多大呢?这是本文要研究的第二个问题.通过数值模拟,主要得到了以下两个结论;
结论4.2.1.X1,...,Xn来自同一总体N(μ,σ2)时,样本均值与截尾均值的数学期望一样,但样本均值方差比截尾均值方差小,这表示此时用样本均值作为中心的估计效果比截尾均值的效果好.
结论4.3.1.样本X1,...,X10来自两个总体,其中X1来自总体N(υ1,σ2).X2,...,X10来自总体N(μ2,σ2),当|μ1—μ2|<1.667σ时,用样本均值作为总体均值的估计更为有效.反之,当|μ1—μ2|>1.667σ时,截尾均值更为有效.