最小二乘法的初等解释

来源 :启迪·上 | 被引量 : 0次 | 上传用户:liujmjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:通过对最小二乘法的系数确定、相关指数、首发权等问题提供初等解释,加深对最小二乘法的理解,体会统计思想的数学基础。
  关键词:最小二乘法;线性回归;首发权。
  对两个线性相关变量做回归分析时,我们会用最小二乘法。看似平常的最小二乘法,实则来之不易,高斯凭借法国子午线弧测算而生与勒让德的首发权之争,延续数年。即便是回归方程的系数的推算,究竟是用微分方法、偏差理论还是矩阵法,亦是值得推敲的。离开了这些思考,单纯把结论告诉学生,那当然就不会重视散点图、残差分析、相关指数等与统计思想有关的概念,听者就只能如坠五里云中。
  在最小二乘法的学习中,如果只重视公式和结论,掐头去尾烧中段,就会失去深入领会统计学思想的契机,在大学后续学习最小二乘法的改进方法,比如岭回归估计、主成分回归、稳健回归等时就产生困难。统计思想才是统计学习中最为重要的。
  下面以高中生的关切度为序,谈几个问题。
  一 系数公式重要吗?
  对于具有线性相关关系的两个变量的一组数据,对它们做线性回归,由最小平方法,得到
  的公式究竟是怎么得到的?首先得明白:需要考察“差异”的总和,而且它越小越好。但是为啥要考察“差异”的平方和,而不是直接考察呢?这当然是从大量计算的方便性来考虑的:不需要进行符号判断,就可以直接进行计算,避免了进行符号判断的麻烦。还有一个原因。举个例子:如果实际值与估计值的差是20(或-20),差异较大,平方后会被放大20倍,变为400;如果这一差异较小,是0.2,那么它平方后就变为0.04.。我们发现,对实际值与估计值的差异平方后,意外地收到了“放大大错误,缩小小误差”的效果。所谓“人非圣贤,孰能无过”?大错不放过,小错看不见,这不也是我们经常做的吗?
  一般的高等数学教材,是把 视作二元函数,分别求偏导,得到驻点。以中学生能够理解的写法,简略表达如下:
  在未学习导数时,如何证明呢?选修2-3的推导如下:
  上式中,后两项与无关,前两项为非负数,因此当前两项为0时,最小。
  如果按照这个方式来讲,其中最大的问题是
  这里,一减一加 “”的原因是什么?技巧性太強、太突兀。
  还有一种解释方法,与大学里的偏差理论有关。其实,在现行课本里已经做了暗示,只是很少有人注意到了。这就是选修2-3课本里章节复习里的一道题:
  其中,为总偏差平方和,记为;为残差平方和,记为;为回归平方和,记为。
  可以说,这个问题是进入偏差理论的一个重要契机,而且回归分析最后的残差分析环节就要用到。如果能理解这个思想,处理下面的非典型的线性回归问题就很轻松了:
  例 关于与有以下数据:
  有如下两个线性模型:(1);(2),试比较哪一个拟合效果比较好?
  由于,所以方程(1)的拟合效果比较好!
  统计学上刻划回归效果的量是相关指数,其计算公式为:,的值越大,说明残差平方和越小,回归效果越好。在本题中,分母实际上就是总偏差平方和,对两个回归方程都是一样的,所以没有必要计算相关指数,而直接考虑残差平方和即可,这其实就是最小二乘法的实质所在。
  回到前面的问题:一加一减“”的原因是什么?咋突然从帽子里跑出来一只兔子了呢?其实,这只是二次函数的最值问题而已!先确定,再求:
  是一个二元函数,先把它看成关于的函数,它是二次的,形如
  又由二次函数的知识知:当 时,取得最小值。至此,都确定出来了。本质上,这是一个初中的二次函数最值问题,用不着“你记住,这是技巧”,或者骗学生说“到了大学再学习”。
  不知大家注意到没有:在上述过程中,“回归直线通过样本中心点()”这一结果是先得到的,这跟用(偏)导数的方法时得到的顺序是恰好相反的。世人都知道“回归直线必然通过样本中心点()”,但是理由是什么呢?不同的方法会得到不同的解释,看来还远不是“记住”那么简单。
  二 散点图与相关指数
  一般的教科书或者教师在讲授线性回归时,都热衷于引用现实案例中的数据,在输入后用Excel,SPSS,TI图形计算器等软件得到回归直线。这样的处理,美其名曰“建模”、“数学实验室”,但是不得不说是一种莫大的遗憾:难道来了数据就一定可以做(线性)回归?绝不是!这种做法忽略了线性回归的前提条件是“线性相关”!因此,首先应该是作散点图。
  高考里对此已经做了考察,2007年广东高考第17题是一道解答题,开了高考解答题考察“两个统计案例”的先河。这道题第一问是根据所提供的数据画散点图。当年好多学生不费吹灰之力就描出了那4个点,然后就把它们用折线图或者直线连接起来,导致煮熟的鸭子飞了,一分也得不到(散点图是不能把这些点连起来的)。这与不重视“散点图”有没有关系?可想而知!
  对于一组数据,根据散点图判断出成线性相关关系后,用最小二乘法得到回归直线,是不是就完事了?没有!还要对这种回归进行评估,要作残差分析,算算相关指数,在此不展开讲。
  三 首发权之争
  最后说说最小二乘法的首发权之争。
  1805年初,法国数学家阿德里安·玛丽·勒让德发现并公布了最小二乘法(当时称为最小平方法)。后来,美国人罗伯特·艾德里安在1808年末或1809年初发表了这种方法,德国数学家卡尔·弗里德里希·高斯则于1809年发表了这种方法。照此说来,最小二乘法的首发者就是勒让德。事实上,也只有一位科学家使该方法变成了普通大众都可以理解的方法,那就是勒让德。
  但是,在1809年高斯发表他的最小二乘法时,他在概念和技术发展方面已经远远超出了勒让德,这使高斯坚信自己的方法才是真正的最小二乘法,他更是宣称自己从1795年起就一直使用这种方法。因为高斯在世界数学界享有无与伦比的崇高的地位,他的这番话导致了科学史上最著名的首发权纠纷。
  后人通过对高斯提出的证据的著作《世界星历概论》的考察,尤其是通过对高斯用最小二乘法测算法国子午线弧的复盘,认为高斯确实是在早于1800年就独立想出了最小二乘法。但是,享有“数学王子”美誉的高斯实在太牛了,他没有认为这个方法有多重要,就没把它发表出来,也没跟任何人交流过。可以说,正是因为太过于聪明,使得高斯错过了像勒让德那样让最小二乘法产生直接和广泛效果的机会。
  【参考文献】
  [1] 茆诗松,周纪芗. 概率论与数理统计[M].北京:中国统计出版社,2000:359-362.
  [2] (美)斯蒂格勒 著,李金昌 等译.统计探源:统计概念和方法的历史[M].杭州:浙江工商大学出版社,2014:248-256,287-288.
  [3] 高惠璇.统计计算[M].北京:北京大学出版社,1995:297-343.
  广东省深圳中学 张红兵
其他文献
摘要:美术教育对开发学生的创造性思维有着不容小觑的作用。因此,作为高中美术教师,要采取有效措施,转变教学模式,丰富教学方法,在美术教学活动中培养学生的创新能力。  关键词:高中;美术;教学;学生;创新能力  美术作为一种高雅的艺术创作,不仅可以提高学生的审美,陶冶学生的情操,还可以培养学生的想象力,激发学生的创造性思维。学生时期是孩子们想象力最丰富的时候,也是培养创造性思维的最佳黄金时期。因此,作
期刊
摘要:新课程对于初中生数学板块有着准确的需求,便是以培育初中生主动学习为目标,提倡“主动、合作、探究”的学习模式。探究式教学时创新式的教学模式,它改善了学生早期的学习方式,充分展现了学生的核心地位,又便于培育学生的数学核心素养,推进学生各方面的发展。本文将以初中数学教学为例进行讲述探究式教学的实验。  关键词:初中、数学、探究式教学  引言:新一轮的课改,是对于目前我国教育界做的一次适应性调动。但
期刊
摘要:幼儿升入大班,通过“我是大班哥哥姐姐”一系列活动的开展,幼儿逐渐树立了自己是幼儿园中的“大孩子”的意识。实践证明,鼓励并引导幼儿帮助比自己年纪小的小朋友,适当开展一些“大带小”的活动,不仅对小班幼儿尽快适应新环境、认识新朋友、建立新常规是非常有效的,而且对于大班幼儿能激发他们关心他人,帮助弱小的情感,转变以自我为中心的意识。  关键词:大带小活动;建立新常规;中心意识  幼儿升入大班,通过“
期刊
摘要:所谓高效课堂,顾名思义是指教育教学效率或效果能够有相当高的目标达成的课堂。在初中教育阶段,有效构建高效课堂则能够达到“轻负担,低消耗,全维度,高质量”这样理想的教学效果。鉴于此,本文即主要从个方面论述了构建初中数学高效课堂的策略。  关键词:初中 数学 高效课堂  一、细化教学目标,构建多维教学体系  通常意义上讲,构建高效课堂的最终目标则是减少教学时间并提升教学效率。在初中数学课堂上,决定
期刊
摘要:对于小学阶段的课堂教学来讲,学生核心素养的培养与提升,不仅仅要在教学方式上进行创新,更需要在教学内容、理念上满足小学生的学习需求,顺应新课改的基本要求,发挥学生自身的个性化价值,让学生感受到学习语文的乐趣,积极创造多元化的教学氛围。教师如何才能借助于多元化的教学方式,帮助学生培养核素养,提升语文课堂的教学效率呢?以下笔者将进行详细分析。  关键词:小学语文;核心素养;教学实践  引言  随着
期刊
摘要:随着新课改的不断发展和英语在全世界的普及,英语教学的要求不断地提升,小学英语作为孩子英语学习中至关重要的开始,不可被忽略。在小学英语教学中,游戏教学不失为一种合适的创新的方法。教育游戏的出现,为教学注入了新鲜的活力,为教学质量提供了新的教学手段,也为践行新教学改革所倡导的教育理念提供了一种新的途径。游戏教学在教学的过程中能够转变主动权,使得孩子们在学习中变得更加主动,还能使得英语学习在寓教于
期刊
摘要:高中英语教学分为单词、阅读、作文和听力四部分,其中单词是学习英语的基础,阅读是对学生所掌握的单词量和解析能力的探究,作文最考验的是学生的沟通能力,听力则是用来判断学生发音是否标准以及能否用英语进行简单对话。本文主要讲述的是高中英语的阅读教学部分,而英语阅读最重要的是学生要有手感和语感,需要进行题海战术,老师课堂上讲授的内容又是有限的,因此需要学生自己总结重难点,这就格外考验学生的自主学习能力
期刊
【摘 要】课堂评价是课堂教学的重要组成部分,基于新课改下,有效的课堂评价不仅能激发学生学习兴趣,让学生感受到被人重视的快乐,心理上得到满足,还能在无形中启迪学生的思维能力,树立学生的学习自信心,进而促使学生朝着更好的方向发展进步。如何在课堂教学中合理科学开展课堂评价,本文就以初中语文教学为例,谈谈初中语文教学中课堂评价的应用策略,以供广大一线语文教师参考。  【关键词】初中语文;课堂评价;新课改 
期刊
【要文】自然拼读法,又 Phonics,它是目前国际上最推的吴语教学方法,也是美国语言启所用的方法,目前很多孩子还在用记忆单宇宇母顺的方法羊美他们把事成一个一个母然后记字母的列序误的学习,不延语言开发的黄金期,也孩子学习的兴,而自然拼读法的最大特点是:它会把复的发音归纳成有规的、简的发音,把英文的母与发音联系起来,和底解决学生学美语发音难,发不准的问题据研完,语河8以上都合一定的发音,只要孩子这些
期刊
摘要:随着我国新课程改革的持续性推进和深入,各个年级和学科都开展了以学生核心素养培养为中心的教学模式与方法优化,初中物理学这门学科同样也不例外。初中物理教师就要充分利用情境式教学方法等具有积极教学价值的新型教学模式来进行日常的课堂教学,以此来有效降低教学内容的理解和学习难度,推动初中物理课堂教学质量和效率的双向提高。本文首先简单分析了初中物理情境创设所要遵循的原则,然后探究了初中物理情境创设的策略
期刊