论文部分内容阅读
随着大数据时代的到来,各种高维复杂数据随处可见.面对高维复杂数据的处理,有学者提出函数型数据分析方法.函数型数据是具有连续性和高维性特征的数据,在分析时需要将此类观测数据看成是一个整体,此时传统数据分析方法不再适用.函数型数据分析中常见的分析方法是数据的变异性分析和线性回归分析.函数型线性回归分析是对两类及以上数据之间的相关性分析.然而在许多学科领域中观测到的数据不仅具有函数型数据特征,而且带有空间属性.本文针对空间数据和函数型数据问题,提出新的部分函数型空间回归模型,并应用到气象数据的研究中.首先,本文构建了响应变量和随机误差项具有空间相关性而协变量既有标量数据又有函数型数据的部分函数型空间回归(PFSAC)模型.然后,在参数估计过程中通过函数型主成分基函数法对PFSAC模型中函数型部分截断处理,再通过极大似然估计法对展开后的模型进行参数估计同时证明斜率函数的大样本性质.考虑到模型的适用性,本文还加入了检验响应变量和误差项是否具有空间相关性、部分线性项是否显著的内容.模拟结果通过均方误差和积分均方误差的有效性分析,并以图像的形式展现了斜率函数及其估计,表明本文所提出的模型是有效的.本文运用函数型主成分方法、函数型空间自回归模型和部分函数型空间回归模型对2019年汾渭平原空气质量数据和气象数据(气温)及经济数据进行分析.函数型主成分方法分析SO2浓度曲线,探讨SO2浓度的变化特征.结果显示,前4个主成分的累积贡献率就已达到94%以上,结合实际情况对SO2浓度的变化特征进行解释.运用函数型空间自回归(FSAR)模型分析逐时温度对月均SO2的影响,并与函数型线性模型的分析结果对比,发现FSAR模型处理SO2浓度与气温数据的拟合效果更好.运用本文提出的部分函数型空间回归模型分析地区GDP和逐时温度曲线对S02浓度的影响,并与广义空间回归模型的分析结果对比,发现部分函数型空间回归模型的确优于广义空间回归模型.同时还对温度曲线进行动态分析,发现温度每月在上升时对SO2浓度的影响较小,在下降时对SO2浓度的影响较大.