回归分析中样本容量的确定

来源 :南开大学 | 被引量 : 0次 | 上传用户:aspbasicer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建立在统计相关分析基础上的回归分析是统计学的经典内容之一,在统计理论方法体系中占有很重要的位置。它不仅内容十分丰富,而且应用也极为广泛。正因为如此,一代统计学大师K·PEARSON曾一针见血地指出,90%的统计学的研究任务就在于讨论和研究不成函数关系的两个或两个以上变量之间的相依关系。在具体应用回归分析原理解决实际问题的时候,究竟使用多大规模的样本,才能实现相关与回归分析的目的,才能达到较好的统计推断效果,这是一个值得重视和讨论的问题。我们知道,样本容量过小,比如极端的情况只有两对观察资料,那么由解析几何两点确定一条直线原理,就没有必要讨论相关与回归分析的随机性,也无法解释为什么要在分析模型中引入随机性因素。观察次数太少,由于样本信息不充分,会导致模型估计结果的稳定性非常差,再就是也无助于揭示和掌握经济现象之间的统计相依关系。样本容量似乎也不能过大,如果盲目要求样本观察越多越好,一方面会增加不必要的数据搜集成本,另一方面可能会造成数据信息上的冲突和干扰,反而不利于模拟出带有统计规律性的东西。更何况在社会经济领域,有许多问题的研究其可供利用的资料来源本来就有限,是非人力可以扩充和增补的。有鉴于此,在相关与回归理论研究中,人们很早就注意到了如何通过有限的样本观察来实现统计相关与回归分析的认识功能,像把经典的回归分析与统计实验设计结合起来,形成的回归分析的正交设计、回归分析的旋转设计、回归分析的最优设计等就是比较典型的例子。原则上讲,这些方法在自然科学和工程技术领域应用比较有效,联系到社会经济领域,由于不具备统计实验的条件,如果一味地依据实验设计的办法确定最优样本容量,操作起来几乎没有多大的可能。由于没有一个客观的数量上的参照依据,在实际应用相关与回归分析时,有关样本容量的确定多半是比较随意的,或者是经验之谈,比如:样本观察数目应该是待估参数个数的倍数,样本容量不能低于30,最好能达到50甚至100以上,把能够搜集到的有用数据都找到等。   在本文中,将基于统计势函数的规则,对简单线性回归分析时模型中的参数推断,以及预测时的样本容量确定问题进行一般性的讨论。
其他文献
在计算机辅助几何设计中,定义在千变万化的拓扑结构上的自由型曲线曲面,存在着千变万化的形式,而广义Ball曲线则是其中一种在曲线求值及升降阶的计算速度方面明显优于Bézier
过去一说起中国共产党的创始人——从中共“一大”到“五大”连任五届的总书记陈独秀,就说他是造成中国共产党在1927年大革命失败的罪魁祸首,是“托派”,并被开除了党籍。他
学位
图像缩放技术是数字图像处理领域中一个研究重点。图像的分辨率调整、格式转换和在PDA等便携电子设备中在有限的屏幕上显示高分辨率的图像都需要使用图像缩放技术。传统的图
伴随着经济全球化和经济一体化的趋势,全球金融市场迅猛发展,金融市场呈现出前所未有的波动,金融机构而临的风险加剧。风险管理问题成为现代金融机构的基础和核心。 开放式基
我在中统的位置1939年8月,湖大招生,我以第二名成绩被录取(经济系)。慈利县与我同时考取的有李文进(别号李子大)、李柏生(王育瑛的外甥)、安齐家(女)等4人。1940年12月,我由
本文主要研究满足K=的闭凸曲面什么时候为单位球面,其中K是高斯曲率,x是位置向量,v是曲面的单位外法向。  本文的具体安排如下:在序言中,我们介绍了高斯曲率流的背景和发展历史
变差和维数是刻画曲面粗糙程度的重要参数。本文主要讨论了网格上自反射及广义的自反射分形插值曲面(即由镜面反射构造出的分形插值曲面)的变差与计盒维数。由于分形曲面插值
本文首次用基于主成分分析的支持向量机划分地震相。基于主成分分析的支持向量机划分地震相的方法可以提高支持向量机分类的训练速度和预测速度,而且不会改变样本的分布特性,还