论文部分内容阅读
经典的数据处理与数据分析是在误差为正态、函数模型为线性模型的基础上,基于最小二乘原理的一整套方法和相关的课题。在测绘科学中形成了如下主要工具用于数据处理与数据分析:(1)参数估计公式;(2)单位权方差估计公式及其chi-平方统计量;(3)巴尔达粗差探测公式;(4)线性假设检验的chi-平方统计量与F统计量;(5)赫尔默特方差分量估计公式。除参数估计(1)外,其余四项内容都需要基本向量(包括观测量、参数估计量、残差向量以及观测量平差量)的方差协方差矩阵具有明显可计算的形式。由于线性模型的最小二乘估计是线性估计,即基本向量可以表示成观测量的线性函数,因此,计算基本向量的方差协方差矩阵不成为困难。Huber定义的M估计是为解决最小二乘估计不稳健而提出,但它同样可用于无粗差时的数据处理与数据分析,因为观测误差有可能不服从正态,并且基于最小二乘残差的方差和方差分量估计并不是全局最优估计。对M估计,除对参数估计(1)有比较深入的研究并形成了完整的算法外,其余四项都没有适用的基于M方法和残差的相应公式,其原因在于线性模型的M估计是非线性估计,即基本向量不能表达成观测量的线性函数,这就使得基本向量无法拥有可计算的方差协方差矩阵。本文针对这些问题进行研究,目的在于建立基于M准则的数据处理与数据分析体系。 在第二章,讨论了基于最小二乘原理的数据处理与数据分析体系,尤其讨论了方差分量估计,指出了赫尔默特方差分量估计与二次无偏估计的关系。对不等精度的高斯马尔可夫模型,赫尔默特方法与二次无偏估计方法所求方差分量估值完全相等;当二次无偏估计方法采用最小二乘残差时,其估计公式就是赫尔默特公式;当采用其它残差时,二次无偏估计的系数矩阵与赫尔默特公式的系数矩阵完全相同,常量部分不同。由于最小二乘法不能定位粗差,当有粗差时,赫尔默特方法与二次无偏估计方法都不能有效的分离粗差,因而不具有稳健性。 在第三章,研究了M估计的定义及其存在性条件,结合测量实际对其进行了扩展。导出了自由网M估计的解的通式,并证明了在不同参考基准下解的转换公式与最小二乘方法相同;研究了正态分布的和极大似然估计,在顾及效率与稳健性的条件下,确定了合适的方差因子;研究了无穷范数估计,构造了基于校正凝聚函数的算法及其稳健化算法。 在第四章,导出了包括秩亏网在内的M估计的基本向量的线性表达式及其方差协方差矩阵的一般表达式,定义了第三个多余参数。针对正态误差分布,导出了基于Lp估计与和极大似然估计的多余参数的数学形式。 在第五章,研究了线性函数模型的方差估计问题。导出了与估计准则和误差分布无关的方差估计统一公式,应用表明该公式可用于无粗差时包括最小二乘估计在内的M估计的精度评定;导出了基于估计准则和误差分布的方差估计公式,可用于分布已知时M估计的精度评定。 在第六章,研究了基于M残差的方差分量估计。对正态误差,导出了基于Lp