论文部分内容阅读
论文以云南省思茅松为研究对象,调查了201块样地.分别用模型的参数估计方法与非参数估计方法得到思茅松标准树高曲线的拟合模型,并对模型的两种估计方法所得结论作了比较和分析.建模中,考虑到林业数据往往含有异常值,为了研究异常值对模型的影响,通过人为引入异常点对含有异常点的数据再进行建模,并对结果进行了分析.一般来讲,模型的估计分为两类:一类是模型类型已知,而参数未知,则模型的估计,本质是估计模型中的未知参数,这种获得模型的方法属于模型的参数估计方法.林业上常用的参数估计方法是最小二乘法,最小二乘估计易于计算,有直观的几何意义,对基于正态分布的线形回归模型,这种估计具有其他估计方法难以比拟的优越性.但由于最小二乘估计的判据(因变量的残差平方和达到最小)只包含因变量的测量误差,未考虑自变量的测量误差,而大多数情况下,自变量也是随机变量,也有误差分布,这种误差的影响能否忽略,在传统方法中并没有得到有效地解决;同时,如果样本较少,最小二乘估计对异常数据会变得比较敏感,从而使模型变得不稳定,这可能造成模型的预估效果变坏甚至使模型失效.针对最小二乘估计的问题,该文将模型的非参数估计方法引入到树高曲线模型的构造中来,使用非参数估计中的核密度估计和最大概率估计方法构造树高曲线模型,所得主要结论如下:1.适当选取核函数和带宽后,非参数核密度估计所得4项传统评价指标均优于最小二乘估计;2.核密度估计方法对数据的依赖较大,用这种方法拟合模型,要求原始数据为大样本,否则模型波动较大;3.核密度估计所得因变量估计值不受第一、二类异常点影响,但受第三类异常点的影响,影响程度总体来说远小于最小二乘估计;4.最大概率估计所得模型的几项传统评价指标总体劣于参数估计所得多项式模型的指标,这主要是因为参数估计的评价方法就是使残差平方和SDE最小,而最大概率方法却是使概率最大,此时所得模型的残差平方和不一定最小;5.非参数最大概率估计方法得到的树高曲线,由于用树高分布的最大概率值所对应的树高与相应的直径对应,以研究树高与直径的关系,因此这种方法所得曲线主要经过样本点最密集的地方,避免了异常值对模型的干扰,所得模型更具稳定性.研究表明,非参数估计适合在自变量和因变量均有误差的情况下建立树高曲线模型,它摈弃了参数估计只考虑因变量统计误差的局限性,因此这种估计方法更符合常理.同时,当样本中含有异常数据时,非参数估计方法所得模型较参数估计方法所得模型更稳定.尽管该论文是以思茅松的两个测树因子:直径和树高建立模型,但非参数估计的方法也可用于其它测树因子模型的建立,并且可以推广到有多个自变量的情形.论文针对思茅松树木的两个测树因子建立了模型并对模型进行了分析和比较,今后尚需对更多的测树因子及更多树种进行建模,以检验模型的非参数估计方法在林业上的应用效果.非参数估计尽管已有不少理论成果和应用实例,但其理论不如参数估计完善,将这种方法应用到林业中,必然存在一些问题有待解决,今后还需要进一步完善该方法.