空间变系数弹性网回归模型及其应用

来源 :新疆大学 | 被引量 : 0次 | 上传用户:xh7304
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息资源急剧膨胀的今天,数据分析领域的一个热点问题是如何处理复杂数据.随着科学技术和经济的发展,很多领域都会面对存储量很大,维数很高的数据以及如何处理的问题.归纳起来,这些复杂数据一般具有维数高、自变量相关,或关键影响因素稀疏的问题.在这种处理复杂数据的情形下,处理共线性和变量选择问题变得越来越重要.变系数模型是探索变量间回归关系动态特征的有力工具,其各类衍生模型及统计推断理论被充分研究,并广泛应用于经济金融、生态环境和流行病学等领域.高维数据和共线性问题给该模型的有效应用带来新的挑战.目前对于变系数回归模型的变量选择的研究方兴未艾,主要是针对非参数部分使用局部二次逼近算法实现无关或低相关变量的收缩估计,未能充分利用参数稀疏性的计算优势;并且当参数维度较高或者变量间存在相关性甚至共线性时,计算过程中矩阵可能呈现病态,甚至不可逆.引入弹性网惩罚有助于解决这一难题.弹性网惩罚项是Lasso惩罚与岭回归惩罚的凸组合,既包含Lasso惩罚,实现了模型的稀疏表达;又包含岭回归惩罚,有效应对多个变量之间存在的复共线性,进而准确辨识模型结构,提升模型在应用中的可解释性.首先,本文将弹性网惩罚项引入变系数回归模型框架下,提出变系数弹性网回归模型(VCM-EN),结合局部线性和坐标下降算法进行变量选择和特征提取,有效地利用系数函数的稀疏性,避免了估计矩阵的病态或不可逆.然后与变系数岭回归(VCM-R)和变系数Lasso(VCM-L)方法进行比较,并做了模拟实验和实证分析.结果表明:在变系数框架下实现弹性网方法对回归系数进行收缩是可行的,并且发现当变量间存在共线性时,VCM-EN方法倾向于将两个影响因素同时保留,能够更准确地识别对响应变量有重要影响的因素,在实际应用中的解释性更好.最后将VCM-EN方法推广到空间上提出空间变系数弹性网回归模型(GWEN),即:将机器学习技术与空间回归模型相结合,研究空间数据高维回归模型的变量选择和结构识别问题.同时做了模拟实验和比较分析,并使用该模型分析了手足口病的空间数据集.结果表明:GWEN模型不仅具有地理加权模型(GWR)的估计准确性,还具有弹性网模型(EN)解释变量多重共线性的优势,为复杂空间数据的分析研究提供了新思路.
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
学位
学位