带有缺失数据的混合空间自回归模型的统计分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:yjszf22222222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这个数据信息量庞大的时代,许多生物数据、医学数据和经济数据等都存在着空间相关性,故不能直接使用传统的回归模型进行分析,而空间自回归模型正好适用于这种类型的数据建模。然而在实际研究过程中,数据缺失的情况不可避免,许多统计方法被学者们运用到缺失数据问题的处理中,研究发现不一样的插补方法会得到不一样的数据集,从而带来不同的分析结果。针对带有缺失数据的空间自回归模型,本文首先选取了均值插补、随机森林插补、回归插补、k近邻插补、多重插补和对抗生成网络插补(GAIN)六种处理缺失值的方法,对模拟数据设置缺失率为5%、10%、20%、30%、40%五种随机缺失的情况,通过比较插补值以及模型参数估计的平均绝对误差和均方误差研究不同插补方法的效果。研究发现:当单变量缺失的时候,回归插补和GAIN能取得较好的效果;当多变量缺失的时候,GAIN、多重插补和k近邻插补能取得相对较好的效果;随着缺失率的增加,各种插补方法的效果逐渐变差。然后,根据对抗生成网络插补的特性,本文提出了改进的对抗生成网络插补方法,并把这种方法记为GAIN-MUL,通过和其他方法进行对比分析发现:从插补误差来看,GAIN-MUL在缺失率高于20%时能够展现相对较好的效果;从模型参数误差来看,GAIN-MUL也能展现明显的优势。总之这种方法为研究者在处理缺失数据时提供了更多的选择。最后,本文研究了带有成分数据的混合空间自回归模型,同时还考虑了带有缺失的情形,运用回归插补的方法把数据填补完整后再进行参数估计,并通过实验对MLE和2SLS这两种估计方法的有效性进行验证。从实验结果中发现:对于带有成分数据的混合空间自回归模型来说,使用MLE和2SLE都能取得不错的参数估计结果;对于缺失的情况,相比于直接删除有缺失的样本,回归插补之后再进行参数估计得到的效果明显更好。
其他文献
富勒烯C60作为一类具有优异电子亲和力的零维碳材料,在催化、储能等领域具有巨大的应用潜力与价值。但由于强烈的π-π相互作用,C60分子在制备和使用过程中极易发生分子间的团聚,从而严重影响其性能,尤其是在需要利用π表面的应用领域。而作为一类新兴的多孔材料,二维共价有机框架(COFs)孤立且规则有序孔道在物质传输、纳米单元的高效分散等应用中具有广阔的前景。利用二维COFs材料规则的孔道装载和离散C60
学位
在世界野生蘑菇贸易市场中,中国云南省以其丰富的野生食用真菌资源而闻名。本研究采集并整理了从2010年至2019年项目组收集的云南省35个市县的3585个野生食用菌样品。用ITS作为食用菌鉴定和分类的分子标记基因,对这些野生食用菌数目进行广泛的统计、对系统发育种进行物种识别等,探讨ITS序列作为野生蘑菇物种鉴定标记的可行性,发现了广泛的隐存种多样性和大量的中国新记录种。另外,使用多基因序列结合形态分
学位
可压缩Euler方程组是流体力学中描述无粘性可压缩流体运动的方程组.论文以二维等熵Euler方程组为例,研究空气动力学中一个非常重要的现象:激波反射,当激波通过楔形物体等障碍物时,会发生反射现象.众多物理实验表明激波反射的类型十分复杂,由激波强度、障碍物形状等多种因素决定,目前关于激波反射现象的严格数学理论还不完善.本文详细推导了激波发生正则反射时对激波强度和楔形物角度的要求,并给出了相应的数值模
学位
图像修复是从退化图像中恢复出潜在清晰图像的过程,近年来在图像去噪、图像去模糊、超分辨率图像重建、图像去雾、水下图像重建和压缩传感图像复原等场景中受到广泛关注。随着图像处理技术的改进和发展,图像修复已在计算机视觉中起着重要的应用,并且成为图像处理研究中一项具有挑战性的课题;但将现有主流的图像修复算法应用于我国的古壁画,其修复结果容易出现重建的边缘结构不完整、填补的纹理分布混乱和纹理不清晰的问题。为了
学位
磁气体动力学系统是一类重要的可压缩流体欧拉方程组,可用来描述具有横向磁场的可压缩流体的运动规律.当压强中的绝热指数取不同数值时,相应地可以得到磁多方气体欧拉方程组和磁Chaplygin气体欧拉方程组.本文在介绍一类输运方程组和一类Chaplygin气体方程组的包含δ-激波和真空的黎曼解的基础上,首先利用特征分析法和相平面分析法,解决这两类欧拉方程组的黎曼问题,其次分析当压力和磁场消失时,其黎曼解的
学位
超薄电解铜箔为覆铜板、印制电路用铜箔,广泛应用于动力类锂电池、3C消费类锂电池及储能锂电池领域。针对原材料及轧辊导致成箔表面粗糙度较大差异的问题,研究了表面粗糙度对高品质超薄电解铜箔性能的影响规律并对机理进行了分析。采用同批次、同工艺、不同轧辊条件下所得铜箔为试样,研究了表面粗糙度对其耐蚀性、耐热性和力学性能的影响,并借助透射电子显微镜对其影响机理进行了分析。结果表明:在同批次、同工艺、不同轧辊条
期刊
车牌识别技术是计算机视觉、图像处理、模式识别和深度学习等多学科相关技术的一种综合应用。无论是基于深度学习的车牌识别技术,还是传统的车牌识别技术,在中国已经被广泛应用。但对于老挝车牌识别技术仍处于初步探索阶段。本文研究了基于Mask RCNN算法的老挝车牌识别方案,并通过实验验证了该方案可以完成对老挝车牌识别的操作。本文调研并对比了传统的车牌识别技术和基于深度学习的车牌识别技术。车牌识别技术多分为图
学位
本文分别研究了一类分数阶神经网络在Stepanov意义下的概自守解和一类整数阶神经网络在Besicovitch意义下的概自守解.首先探讨了一类具常时滞的分数阶四元数值神经网络在Stepanov意义下的概自守解的存在性和有限时间稳定性,并举出数值例子说明了结论的正确性.其次引入了Besicovitch意义下的概自守函数的概念并证明了相关性质.作为应用,我们研究了一类具常时滞的整数阶四元数值神经网络在
学位
在科学技术飞速发展的今天,摄像机标定的技术也应不断提升,才能紧跟社会发展的潮流.本文根据中心折反射摄像机的单位球投影模型,提出了利用空间直线标定中心折反射摄像机的算法,基本思路如下:由中心折反射摄像机下的单位球投影模型可知,当空间中存在着至少两条不平行的三条直线时,首先投影在单位视球上相交可形成三组对拓点,对应在像平面上可形成三组对拓像点,根据对拓点的连线必经过单位视球球心可知,对拓像点连线必经过
学位
非线性特征值问题在阻尼结构动力分析、时滞系统稳定性分析、量子点的数值模拟和流固结构振动分析等领域有广泛应用,其特征值对于实际问题的解决至关重要.本学位论文研究了非线性特征值的定位问题,给出了其特征值的三个新定位集,具体为:首先应用两行元素及非奇异矩阵类与非线性特征值包含区域的对应关系,得到非线性特征值的Brauer-型定位集,DZ-型定位集和S-SDD定位集;其次证明了上述结果分别优于[Kosti
学位