线性回归模型的稳健估计及多个异常点诊断方法研究

被引量 : 23次 | 上传用户:lzhonline276
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在医学科研过程中,当实际数据不符合既定线性回归模型暗含的理想分布或模型选择有误而有异常数据出现时,经典的最小二乘估计会受到很大影响甚至得到完全错误的结论。本研究在回顾、比较某些现代回归分析研究成果基础上,重点解决多个异常点存在时经典方法不能奏效的回归诊断与影响分析问题,并尝试提出对现有方法的改进,同时探讨某些稳健性较高的回归估计方法,以实现对医用回归分析中某些病态数据的“诊疗”方法,促进医学回归分析的正确应用。 1.概要介绍了稳健统计方法的起源、发展、定义及其分析目的与主要研究内容,描述了Huber的最小最大方法与Hampel的极微小方法基本思想,强调稳健性与估计的一致性、有效性、无偏性等一样应成为评价某一统计分析技术的重要指标,经典方法属于相应稳健方法的某个特例。 2.结合稳健性理论的有关内容对稳健回归估计技术作出了较为全面的回顾与评价,在此基础上详细探讨了线性回归模型的M估计、GM估计、基于Wilcoxon秩次的R估计、高失效点HBP估计及其基础上的两阶段稳健回归方法及其稳健性质,给出了它们的估计与假设检验算法。其中首次将Rousseeuw & Croux用于单变量情况的尺度估计S_n引入稳健回归,比常用的绝对离差中位数MAD作尺度参数估计提高了估计效率。 3.说明了回归数据中异常点的分类、可能的发生原因及其处理原则,介绍了基于数据删除模型与均数漂移模型的经典诊断量,并分析了多个异常数据情况下掩盖与淹没现象带来的困难及后果,针对此问题详细回顾了文献中尝试解决回归诊断中掩盖现象的方法,指出其中存在的问题。 4.使用了稳健估计得到的标准化残差或稳健距离作为诊断量并结合其直观的诊断图示可将回归数据分为正常点、垂直异常点、无影响异常点和有影响异常
其他文献
中学思想政治课是学校德育工作的主渠道,党和国家历来十分重视思想政治课的建设工作,新中国成立后,中学思想政治课经历了多次变革。本文运用历史与逻辑相统一的研究方法,通过
"剩女"在女性获得参与社会和政治机会的当今时代蔚为大观,因而多数人自然而然地认为"剩女"是现代社会的产物。其实,"剩女"早在中国的诗经时代就已经出现,《诗经.召南.摽有梅
土地储备制度是集约利用和优化土地资源的重要手段之一。随着城市化进程的快速发展,土地储备的管理工作变得越来越重要,建立完善的土地储备管理信息系统势在必行。传统的GIS
国内旅游行业的快速发展,带动了酒店业的迅猛发展,同时也加剧了酒店行业的竞争。酒店客房收入是酒店收入中最重要的部分,酒店客房定价的好坏会对酒店的收入和利润产生很大的影响
计算机和网络技术的不断发展,使得网络上的商务行为越来越普遍,信息资源也越来越多。相对而言,客户的时间成本成了相对稀缺的资源。因此,适应网络和信息发展的需要,利用计算
随着经济的快速发展,城市建设规模不断扩大,国家电力建设也在慢慢扩大,工程建设的任务与日俱增,所以,对于电力工程竣工的验收要求较高。要想保证电力工程竣工之后能够发挥其
工作研究作为工业工程体系中最重要的基础技术,它诞生于19世纪末20世纪初,虽然时间不算久远,但是它为各国企业带来了巨大的经济效益和社会效益,在全世界产生了广泛且深远的影
反导作战管理技术是指对反导体系内的传感器和火力资源进行以任务规划为核心的指挥与控制技术,主要包括传感器资源作战管理和火力资源作战管理两大部分。首先对反导作战管理
微量元素锌广泛存在于生命体内,含量过低会造成人和动物免疫力的下降,并影响机体正常的生长发育。许多资料表明我国儿童缺锌现象比较突出,并且我国饲粮需锌量的1/3以上要人为添加