回归分析中异常值诊断方法的比较研究

被引量 : 0次 | 上传用户:wacolt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
回归分析是一种统计学上分析数据的方法,其目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测、控制研究者感兴趣的变量。经典的线性回归模型理论创立以来,被广泛应用于自然科学与社会科学等许多领域中,并取得许多成果。但是应用回归分析的时候经常存在异常值,这些异常值会直接影响到我们所做的回归模型与现实情况是否能很好地拟合、以及参数估计的精确程度、模型的稳定程度等一系列涉及到回归分析本身的问题。因此,对异常值的诊断和处理是一个兼具理论意义和实际意义的问题。异常值的诊断方法一直备受学者们的关注,但是迄今为止,还没有一种标准或者广泛适用的方法。本文对应用较为广泛的两类诊断异常值的方法——基于LS的和基于稳健回归的诊断方法做了一定的介绍。论文先简要介绍了前一类方法,并对该类方法进行了总结,指出各种方法在应对不同异常值诊断时存在的缺陷,进而引出后一类方法,本文的重点也在于研究回归分析中稳健的异常值诊断方法,通过模拟,研究各种方法在异常值诊断中的效率,并且将几种常用稳健诊断方法的效率进行比较,探讨不同异常值出现的情况下,最为有效的诊断方法。论文共分六部分,首先是绪论部分,主要给出回归分析中有关异常值的综述总结;第二部分主要介绍有关异常值的定义、分类及各种异常值对回归分析结果的影响;第三部分主要讨论目前对回归分析中异常值诊断和处理的方法以及各种方法的适用性和不足;第四部分通过模拟出各种情况的异常值,在简单回归模型和多元回归模型中分别采用常用的几种异常值诊断方法,将各个方法的诊断效率进行比较;第五部分给出真实案例并进行分析;最后介绍本文的结论、不足及未来的工作。
其他文献
中美两国相隔浩瀚的太平洋,未来最可能发生矛盾和冲突的地点是海洋。美国在冷战结束后稳坐海洋霸主的“头把交椅”。近十年来,国际格局的多极化趋势越来越明显,美国的相对优势正
嫩江八里罕断裂带位于东北地区中部,大兴安岭的东缘,为松辽盆地的西缘边界控盆断裂。为系统研究嫩江八里罕断裂中段,即扎鲁特旗南部地段的构造形迹及活动时代,本研究在1∶5万
本论文对米糠蜡中二十八烷醇的提取工艺进行了优化,并对二十八烷醇作为一种新型饲料添加剂的毒理学和在畜禽动物上的应用效果进行了研究。通过对溶剂法从粗糠蜡中制取精糠蜡
锂离子电池由于具有较高的能量密度,已经在数码类电子产品中获得成功且广泛的应用,未来将在新能源和储能领域蓬勃发展。因为锂离子电池包含有价金属元素和含氟电解液,所以电
随着计算机技术和电子技术的发展,嵌入式系统在国防、工业、通信、交通、消费电子等领域中的作用越来越重要,已经几乎渗透到我们生活的每个角落。CAN总线(Controller Area Ne
目的通过检测瑞舒伐他汀治疗不稳定型心绞痛(UAP)患者的血脂、高敏C-反应蛋白(hs—CRP)、同型半胱氨酸(HCY)及N末端B型钠尿肽原(NT—proBNP)水平,观察瑞舒伐他汀对UAP患者血脂、炎性反
随着来华西医留学生医学教育的发展,临床阶段的培养模式和质量保障成为留学生医学教育的瓶颈。文章探讨了天津医科大学总医院10余年来全英文临床教育教学模式、临床教学质量保
多年来以灌输和外在约束为特点的德育方法,一定程度上忽视了学生主体在道德成长中自主意识的培养和自主能力的锻炼。实践证明,丰富多元的、博采众长的德育模式是中小学德育取得
华北高产粮区冬小麦-夏玉米种植体系内集约化生产中水氮过量投入导致地下水硝酸盐等面源污染问题突出,亟待解决。本研究选择1990年以来江北建成的第一个吨粮县-桓台县为研究
有机基质栽培已经成为设施园艺中避免连作障碍的一种有效技术。但是对于基质的水分特性及其检测方法还少有研究,这就导致基质栽培中的水分灌溉尚达不到合理和精确的程度,影响