SPSS中判别分析的使用

来源 :文教资料 | 被引量 : 0次 | 上传用户:ch32918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 判别分析是多元统计分析中最常用的方法之一。该文结合一个语言学实验的例子对SPSS判别分析的操作步骤和输出结果作了详细的介绍,并对判别分析的不同方法在SPSS中的使用进行了区分。
  关键词: SPSS 判别分析 语言学
  1.引言
  判别分析是多元统计分析中判别样本所属类型的一种常用方法。它的研究对象是训练样本,也就是说原始数据的具体分类是事先已知的,然后根据原始数据求出判别函数将待判样本的数据代入判别函数中判断其类型。[1]常用的判别分析方法主要有:距离判别法、Fisher判别法和Bayes判别法。然而,在SPSS操作中只能实现Bayes判别法与Fisher判别法两种,并且这两种方法的操作是合在一起进行的,所以使用起来需要特别注意。[2]下文将结合一个语言学实验的例子对SPSS判别分析的步骤和输出结果作详细解释和说明。
  2.语言学实验
  2.1实验背景
  Fletcher和Peters(1984)研究发现,可以用语法和词汇两个维度来刻画语言受损儿童在语言表达方面的特征。被试分为两组,一组是20个正常儿童(LN),另一组是用标准化测试尺度在年龄和智力活动方面跟LN组相比而诊断为语言受损的9个儿童(LI)。在标准条件下收集他们的自发的语言数据(LN组的年龄均值为60.86个月,LI组的年龄均值为62.33个月)。围绕65个语法与词汇范畴——大部分引自Crystal、Fletcher和Garman(1976),每组儿童提供的样本都包括200个话语的得分。其中一个语法变量是根据无标记动词形式——既无后缀又无助动词修饰的实义动词词干——的个数来评分的。另外一个词汇范畴是动词词型,即一个儿童在样本中使用不同的实义动词的个数。[3]
  2.2数据录入
  本文使用的SPSS为20.0版本。首先建立一个数据文件linguistics.sav,将Fletcher和Peters所提供的每个被试的数据录入进去。数据文件的变量视图和数据视图分别如图1和图2所示。在变量视图中,定义变量Y(分类)的值标签,-1为语言受损,1为正常。在数据视图中,共29行数据,分别为29个被试儿童在x1和x2这两个变量上的得分及所属类别。
  图1 变量视图
  2.3判别分析步骤
  ①单击“分析”→“分类”→“判别分析”,从对话框左侧的变量列表中选中进行判别分析的变量“无标记动词形式[x1]”和“动词词型[x2]”进入“自变量”框,作为判别分析的基础数据变量。从对话框左侧的变量列表选中“分类[Y]”进入“分组变量”框,并单击“定义范围”按钮,在“定义范围”对话框中,定义判别原始数据的类别数,在最小值处输入-1,在最大值处输入1。分析方法按默认的“一起输入自变量”。
  ②打开“统计量”对话框,在“描述性”中,选择“单变量ANOVA”和“Box’sM”。在“函数系数”中选择“Fisher”(注:此为Bayes选项)和“未标准化”(注:此为Fisher选项)。
  此外,“均值”可以输出各类中各自变量的均值和标准差。“矩阵”选项组可选择自变量的系数矩阵。
  ③打开“分类”对话框,在“先验概率”(注:此为Bayes选项)中,按默认选择“所有组相等”。在“使用协方差矩阵”中,按默认选择“在组内”。在“输出”(注:此为Bayes选项)中,选择“摘要表”和“不考虑该个案时的分类”。在“图”(注:此为Fisher选项)中,选择“合并组”、“分组”和“区域图”。
  此外,“个案结果”可以输出每个观测量包括判别分数实际类预测类(根据判别函数求得的分类结果)和后验概率等。
  ④打开“保存”对话框,选择“预测组成员”、“判别得分”和“组成员概率”。
  全部选择完成后,单击“判别分析”对话框中的“确认”按钮。
  2.4判别分析结果
  ①适用条件检验。在“统计量”对话框中,选择“单变量ANOVA”和“Box’sM”,可分别得到下面的表1和表2。表1中的Sig值表示这两个变量均值在各组间都是有差异的,因此这两个变量对类间的判别都是有作用的。表2中的Sig值表示组间协方差齐这一假设是被拒绝的。不过,协方差齐的这一要求在实际应用中往往是被忽视的。[4]
  ②基本输出结果。表3给出了判别函数的特征根以及判别指数。本实验中只有一个判别函数,所以只有一个特征值。表4中的Sig值表示差异达到显著水平,即这个投影函数能将两组儿童区分开。从表5中,可以看出判别函数主要与“动词词型”这个自变量相关。由于本实验只有一个判别函数和两个自变量,那么可以推测在区分正常儿童和语言受损儿童上,“动词词型”这个变量在判别分析中起了主要作用。表6是各组的判别函数的重心。注意此处使用的是非标准化典型判别式函数。
  ③三种判别式。判别分析默认会给出表7的判别函数,其中的判别函数使用的是标化变量。如果在“统计量”对话框中,选择“未标准化”,可以得到表8的判别函数;选择“Fisher”,可以得到表9的判别函数。注意此处“Fisher”复选框对应的实际上是Bayes判别。
  标准化典型判别式为:
  F(X)=-0.684×Z无标记动词形式 0.785×Z动词词型(变量前加Z表示标化后的数值)
  未标准化典型判别式为:
  F(X)=-2.046–0.060×无标记动词形式 0.190×动词词型
  Bayes判别式为:
  语言受损=-13.760 0.285×无标记动词形式 0.897×动词词型
  正常=-17.050 0.167×无标记动词形式 1.271×动词词型
  ④图表。由于本实验只有一个判别函数,所以没有产生区域图和合并图,只有如图3和图4所示的分组直方图,从直方图中可以大致看出各组中样本的分布情况。   图3 分组直方图(语言受损)
  图4 分组直方图(正常)
  ⑤分类结果。在“分类”对话框中,选择了“摘要表”可以得到表10中的上半部分,是采用回代法得到的判别信息,由表可见有96.6%的正确率,其中语言受损有1例错判。在“分类”对话框中,选择了“不考虑该个案时的分类”可以得到表10中的下半部分,是采用交叉验证法得到的判别信息,本实验中正确率为86.2%,其中语言受损有1例错判,正常有3例错判。
  ⑥保存结果。运行判别分析后回到数据文件的数据视图,如图5所示,生成了新的变量。在“保存”对话框,选择“预测组成员”,产生“Dis_1”变量,显示的是各样本按Bayes判别所属的类别;选择“判别得分”得到“Dis1_1”列,是样本在Fisher投影函数下投影的坐标;选择“组成员概率”得到“Dis1_2”和“Disc2_2”,为样本分别属于第1类与第2类的后验概率大小。根据表10所示,语言受损有1例错判。在图5中可以看出,语言受损儿童中错判的是第3例,因为其第2类的后验概率0.90727大于第1类的后验概率0.09273,因此判别为第2类。此外,“Dis1_1”的值还可以结合表6的类中心坐标使用距离判别法进行类别判别。
  3.结语
  综上所述,SPSS只能完成Bayes判别与Fisher判别,无法直接完成距离判别。SPSS判别分析是以Bayes判别为主,主要菜单与选项都是针对Bayes判别分析设置,并且最终保存的判别结果也是以Bayes判别为依据;Fisher判别操作仅给出投影表达式、各类投影中心坐标及投影分界图,最终判别结果需要自己根据各类投影中心坐标或投影分界图去做判别。[5]此外,由于判别分析有着比较严格的前提条件,比如自变量和因变量间的关系要符合线性假定等等。当自变量和因变量间的联系为比较复杂的非线性函数,甚至无法给出显式表达时,这些基本的判别法就不适用了。而SPSS在“分析”菜单中,还提供了“树”和“神经网络”,这些方法均为非参数方法,因此没有太多的适用条件限制,应用范围更广,也更适合对各种复杂联系进行分析判断。
  参考文献:
  [1]任志娟.SPSS中判别分析方法的正确使用[J].统计与决策,2006(2):157.
  [2]陈希镇,曹慧珍.判别分析和SPSS的使用[J].科学技术与工程,2008,8(13):3567-3571.
  [3][英]Woods,A.等著.语言研究中的统计方法[M].陈小荷等译.北京:北京语言文化大学出版社,2000:275-280.
  [4]张文彤.SPSS统计分析高级教程[M].北京:高等教育出版社,2004:261-277.
  [5]陈敏琼.利用SPSS进行判别分析的几个问题的说明[J].现代计算机(专业版),2015(2):34-39.
其他文献
摘 要: 文章通过自编问卷对高校师范类毕业生进行就业素质及影响因素的调查,在对调研数据研究和分析的基础上提出建议,以促进高校师范生与社会需求的无缝对接。  关键词: 师范生 就业现状 应对策略  由于我国高校扩招,毕业生人数逐年增加,2015年已达到749万。目前普通大学生就业形势十分严峻,师范类毕业生的就业形势同样不容乐观。过去的几年,全国大部分地区,由于高中教育的普及需要大量教师的原因,
摘 要: 为贯彻落实事教育部的精神,全国各类院校积极推行从校级、省级到国家级精品课程建设的教学实践,并开展了很多精品课程建设的教学研究。本文探讨旨在培养学生能力基于信息技术的精品课程建设路径,提出在精品课程建设中应用信息技术提高学生能力的解决方案。  关键词: 精品课程建设 国贸专业 现代信息技术  教育部在《关于启动高等学校教学质量与教学改革工程精品课程建设工作的通知》中指出精品课程是具有
摘 要: 南京特教学院为了顺应特殊教育发展及社会人才的需要,增设了音乐教育(音乐治疗方向)专业,调整了人才培养规格,目的是培养具有“双师应用型”人才,即有双重能力的音乐教师——既具有较高的音乐教育水平又有一定的音乐治疗能力。只有在高等音乐教育背景下摸索出科学的音乐治疗人才培养模式,才能实现“双师应用型”人才的培养目标。  关键词: 高等音乐教育 音乐治疗 人才培养模式  由于特殊儿童在生理、心理上
摘 要: 在科技创新日新月异的今天,以数字技术为基础的互动媒体艺术作品表现得十分活跃。技术手段的应用直接左右互动媒体装置作品的艺术形式,反之,创新的互动艺术形式与表现技法是技术应用的有力推动。文章对一系列以LED灯光为媒介的互动装置艺术作品为案例,在技术应用上进行剖析及互动手段的研究,探索归纳了声感互动、光感互动、触感互动及综合互动等艺术形式,阐明了互动媒体艺术创新与科技应用的关系。  关键词:
摘 要: 钟嵘在《诗品》中称其为“古今隐逸诗人之宗”的东晋末诗人陶渊明,最为后世称道的除了他的隐逸之举外,就属他的田园诗了。这些诗中,“酒”这一意象出现频率很高,而且被诗人赋予了丰富而深幽的寄托与含蕴;酒也是陶渊明隐居时的密友良朋。文章通过对陶渊明田园诗中“酒”这一诗歌意象蕴含的探析,探讨陶渊明之归隐及其诗酒田园的独特魅力。  关键词: 陶渊明 诗歌意象 酒  酒之于陶渊明,可以说不可或缺却
摘要:从一定意义上说,作文首先是“想”出来的,然后才是“写”出来的。写好一篇优秀的记叙文离不开三个方面,一是有个好故事,二是精加工,三是有点意味,这也成为作文评判的三个标准:题材、结构与立意。其中好故事是基础,好故事离不开好题材,而好题材却是学生作文极其匮乏的。作者认为,选择好题材是避免平庸化现象的第一步,可以尝试给记叙的人物赋予特定身份,而且第一人称“我”的视角叙写的策略。  关键词:记叙文 题
摘 要: 《何典》是一部奇特的近代白话小说,其藐视一切的魄力,无规无矩的写作方式,以及彻底的口语化、俗语化,既是对传统文学的叛逆,又是对俗文学的真实回归。正是在这一意义上,《何典》在颠覆经典的同时,自身也成为了经典。  关键词: 《何典》 叛逆 创新 反讽式幽默意味  一、关于《何典》  《何典》是一部非常奇特的近代汉语白话小说,清代乾嘉时期人张南庄所作。由于小说的反传统,作者又是个在野才子,从嘉
摘 要: 近年来,随着台湾电影《天台爱情》、《那些年,我们一起追的女孩》、《翻滚吧,阿信》、《一页台北》等影片在内地的上映,再一次掀起了内地台湾电影的热潮,作为90后的我们,在看惯了美国好莱坞大片的惊心动魄之后,偶有机会接触到几位来自台湾导演的作品,就如众星争辉中闪过一道光芒,抓住了我的目光,而在2004年以《飞跃情海》一片荣获第18届日本福冈亚洲影展“评审团大奖”的新锐女导演王毓雅,更是成为了这
摘 要: 信息化教学设计是推动教学信息化的关键环节,是信息环境下课程改革的必由之路。本文以《旅游文化》课程为研究对象,选取“探访帝陵”单元为例展示了其信息化教学设计过程。  关键词: 旅游文化 信息化 教学设计  《国家中长期教育改革与发展规划纲要(2010-2020)》指出信息技术对教育发展具有革命性影响。2012年教育部发布的《教育信息化的十年发展规划(2010-2020)》明确提出职业教育信
摘 要: 澳大利亚TAFE模式充分发挥了行业企业在职业教育中的主导作用,认为行业企业一方面主导了国家培训局等各级TAFE管理咨询机构,另一方面通过专业设置、课程建设、师资队伍建设、实训基地建设等方面主导了TAFE学院的专业建设工作,提出了深度吸引行业企业参与职业教育、进一步发挥行业教学指导委员会作用、创新校企合作模式等建议,促进国内高职教育的发展。  关键词: TAFE模式 行业主导 办学体制