统计数据异常值诊断方法及应用

被引量 : 0次 | 上传用户:yyj55555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运用统计数据分析与预测国家经济特征及走势已是众多专家学者乃至业余人士的惯用方法,然而随着信息化的深入发展,人们对数据质量提出了越来越高的要求,新的数据质量诊断理论应运而生,方法越趋完善,其中对异常值的识别与处理是数据质量诊断过程中一个不可忽略的问题。本文主要从回归模型和残差分布两个方面讨论异常值的识别问题,通过对某一模型或概率分布下各种检验统计量的总结和比较,得出检验假设条件下异常值的最优方法,并运用该方法来检验我国一些宏观统计指标数据是否存在异常。在常规回归模型中,异常值是指对既定模型偏离较大的数据点。通过建立数据删除模型来分析某一数据点对回归分析的影响,如果该点对回归方程估计量的影响超过临界值,那么就判定该点为异常值。随着经济现象之间的关系越来越复杂,很少单纯地存在简单线性关系,于是本文在总结前人关于参数与非参数模型下异常值检验的经典研究基础上,把相应方法拓展到半变系数模型中,并利用该方法以具体模型开展实际应用分析。在样本统计数据中,异常值是指与数据集的主体并非来自同一分布的点,即与大部分数据不服从同一样本分布的点。尽管目前各国学者对正态分布、指数分布、极值分布、威布尔分布等分布下异常值的识别问题都做出了杰出贡献。在总结非正态分布下异常值检验问题的基础上,本文针对Ⅰ型极值分布提出能在任何情况下都避免屏蔽效应的新的统计量——F’型统计量;其次,概括了正态分布下异常值的各种检验统计量与检验方法,并借助“相对统计量”的概念对正态分布下三种常用的检验统计量进行了检验功效的比较。最后,在总结和评价本文主要结论及贡献的基础上,对异常值诊断的未来发展方向做了一些展望。
其他文献
艺术丰富了人们的生活,提高了生活质量。越来越多的文人志士把绘画作为一种业余爱好。然而,绘画的基础就是素描,通过铅笔运用不规则的线条以及各具特色的几何图形构思,进行艺
随着我国经济的发展以及人均收入的大幅度提高,私家车的数量越来越多,随之而来的是对停车位的需求越来越大。大城市的土地面积有限,为了解决这种问题,地下车库随之出现。地下
在格物致知问题上,船山神契朱子,卫护朱学,同时又有新的发展.船山高度评价朱子以<大学>格物为始教,并且与朱子一样,把"物"的范围看得很广,包括自然界和人类社会的一切物质和
针对我国褐飞虱Nilaparvata lugens(Stl)近年来严重为害及其对当家农药品种抗性急剧上升的现状,本项目在华中、华南、华东地区等代表性地区开展褐飞虱灾变规律、抗虫品种培
只有疲劳的训练才有效果,没有恢复的训练就是危险。这两者因素之间决定了运动员在运动训练上和提高成绩方面发挥着关键作用。如今,越来越多的学者认为体育运动恢复的重要性,
区域科技发展规划是国民经济和社会发展规划的重要组成部分。在实际工作中,区域科技发展规划的执行控制和评价对与完善科技管理体制机制,科学制定后续科技发展规划具有重要指
大跨度桥梁作为交通线上的枢纽工程和生命线工程,而大跨度桥梁具有结构轻柔的特点,在地震作用下动力响应较大。流体阻尼器作为耗能减震器中重要的一种形式,很早就在航天、机
近日我阅读了《世说新语》,在生动的讲述里,我试图勾勒出魏晋南北朝时期君子的轮廓。$$君子至情至性。“荀巨伯远看友人疾值胡贼攻郡,友人语巨伯曰:‘吾今死矣,子可去。’巨伯曰:‘
报纸
乒乓球机器人作为一个高新技术高度集成的平台是当前国内外研究的热点之一,机器视觉伺服系统作为乒乓球机器人的“眼睛”,提供给大脑外界信息以完成击球任务,实现感知、预测
针对提升土壤肥力,提高土壤质量,保障我国粮食安全的迫切要求,以大多数农作物能与丛枝菌根真菌(arbuscular mycorrhiza fungi, AMF)建立共生关系为基础,利用土壤本身的生物学