Patch方法在PLS路径建模中的研究及应用

来源 :科学与财富 | 被引量 : 0次 | 上传用户:luhaohui923
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:在PLS路径建模中,“二级潜变量”没有对应显变量而不能建模的情况。“二级潜变量”通常对应多个“一级潜变量”,采用Patch方法可算出这些“一级潜变量”的第一主成分得分,并且把这些主成分得分作为二级潜变量的显变量,这样便满足了建模的条件。本文基于R软件,以员工满意度为实例展示Patch方法的应用,并对Patch方法作进一步研究。
  关键词:PLS路径建模;二级潜变量;Patch方法;员工满意度
  Abstract:Models with latent variables of second order, the way they are customarily represented (with no manifest variables), are not allowed in the PLS-PM framework: an LV with no indicators has no place in PLS-PM. The process of the patch approach is a little bit tangled. In the first step we compute latent variable scores of the 1st order constructs with PCA. In the second step, we can run a PLS-PM analysis using the PCA scores of 1st order constructs as indicators of the second order constructs. Through the example of employee satisfaction, the thesis demonstrates the application of Patch approach with the statistical software R.
  Keywords: PLS-PM; second-order construct; the Patch approach; satisfaction of employees
  1 PLS-PM基本概述
  结构方程建模(structural equation modeling, SEM)又称路径建模(path modeling)。从二十世纪六十年代后期开始,该理论方法处于不断发展和被更新状态,许多专家学者利用结构方程建模方法进行各领域的研究,并把研究成果写成文章。因此,该理论方法得到不断的丰富。
  结构方程模型主要有两种分析方法:第一,偏最小二乘方法(partial least squares,PLS);第二,协方差方法(LISREL方法)。过去,由于统计软件的限制,偏最小二乘法(PLS)的知名度不如协方差方法高。不过,由于R软件的高速发展,已经有多个关于PLS的软件包可供使用,这使得PLS路径建模方法具有很强的操作性。
  PLS路径建模方法(PLS-PM)是一种验证性的理论方法,具体步骤如下:首先,根据已有的理论或假设构造模型,画出路径模型图;其次,找出相关潜变量的显变量,制作调查问卷收集数据;最后,基于全部数据,进行PLS路径建模。
  下图为经典员工满意度路径模型图,该路径模型中的六个变量均为不可观测的变量,称为潜变量(LV)。图中的箭头表示因果关系,其中没有被箭头指向的潜变量称为外生变量(exogenous variables),有被箭头指向的潜变量称为内生变量(endogenous variables)。如图所示,“员工期望”便是一个外生变量,它是“员工期望”、“员工感知”、“员工满意度”和“组织承诺”的原因变量,当然内生变量也可能是其他潜变量的原因变量,如“员工感知”就是“员工满意度”的原因变量。
  图1 经典员工满意度路径模型图
  PLS-PM有几个显著特点:第一,PLS-PM对数据的分布没有任何假定,完全利用原始数据进行建模;第二,PLS-PM可适用于小样本;第三,在路径模型图中某些潜变量之间虽没有箭头,但是PLS-PM假定全部潜变量均是相关的;第四,PLS-PM适用于关注隐变量得分的情况, 比如满意度指数。
  2 多级潜变量模型和Patch方法简介
  2.1 多级潜变量模型
  这一节主要介绍一种特殊模型的PLS路径建模应用,这个特殊的模型称为多级潜变量模型。为了更深刻地理解多级潜变量模型的概念,利用二级潜变量模型的实例进行详细说明。如图2,二级潜变量路径模型包含五个潜变量,其中“MI”、“DOP”、“PRE”和“GRO”均为一级潜变量,它们分别指向二级潜变量“PER”。需要说明的是:一级潜变量至少有一个显变量(MV)与之对应,而二级潜变量仅有一级潜变量与之对应,没有对应的显变量(MV)。
  图2二级潜变量路径模型图
  2.2 Patch方法简介
  根据Gaston Sanchez(2013)的观点,潜变量必须至少有一个显变量与之对应,否则不能进行PLS路径建模。针对二级潜变量没有对应显变量的问题,使用Patch方法。
  Patch方法,又称两步法。顾名思义,这种建模方法需分两步进行,步骤如下:第一步,使用因子分析或主成分分析(PCA)计算低级潜变量的第一主成分得分;第二步,把计算后的低级潜变量的第一主成分得分作为高级潜变量的显变量,如此便解决了高级潜变量没有显变量的问题。
  2.3 评估指标
  PLS路径模型包含两个模型:一是外部模型;二是内部模型。外部模型也称测量模型,内部模型又称结构模型。PLS路径模型的评估包括三部分:维度唯一性检验、外部模型评估和内部模型评估。   2.31 唯一维度检验
  要诊断一个PLS路径模型,首先要在评估该模型的测量模型(measurement model)。在测量模型中,每个潜变量包含一组“反映型”显变量,这些显变量必须满足维度唯一性。检验显变量的维度唯一性指标有Cronbach’s a系数、Dillon一Goldstein’s rho和对每个维度下的测量变量进行主成分分析的前两个特征根的值eig.1st和eig.2st。其中,Cronbach’s a系数和DG’s rho的值要求均大于0.7,而eig.1st的值要求大于1且eig.2st的值要求小于1。
  2.32 外部模型的效果评估
  (1)负载系数(loading)
  在PLS-PM中,显变量与其对应潜变量之间的负载系数可以评价显变量的信度,负载系数的一般标准是大于0.7,原因显变量与其对应潜变量之间的共享方差必须大于50%,目的是使其大于误差所解释的方差。
  (2)共同因子(Communality)
  共同因子是一个衡量预测能力的指标,主要针对测量模型中的潜变量对显变量的预测能力,共同因子的值等于观测变量的方差中由潜变量解释所占的比例。该指标的公式如下:
  2.33内部模型的效果评估
  关于PLS路径模型内部模型效果评估的指标主要有以下两个。
  (1)内部模型R2
  R2 主要用于衡量内部模型的解释能力,每一个内部方程可以通过OLS回归得到,并且利用R2 评估其解释能力。
  根据Chin(1998)和 Gaston Sanchez(2013)的观点,当R2 大于0.5时,表示具有良好的拟合效果;当R2 大于0.3且小于0.5时,表示具有一般的拟合效果;当R2 小于0.3时,表示具有较差的拟合效果。
  (2)冗余度(Redundaney)
  冗余度与共同因子值类似,也是一项衡量预测效果的指标,不过冗余度是用来评价模型整体预测关系的,它衡量潜变量对其显变量的预测能力,冗余度值等于共同因子值与内部模型R2 乘积。公式如下:
  (2)
  3 PLS-PM结果的实证分析
  应用R软件,以员工满意度路径模型为例,使用Patch方法进行PLS路径建模,对结果进行深入研究和分析。
  3.1 数据描述
  本文员工满意度数据的样本量为120,包括10个潜变量和27个显变量,显变量就是调查问卷中的选题,选题选项基于李克特五级量表,五个选项分别为:1、完全不同意 ;2、不同意;3、既不同意也不反对;4、同意;5、完全同意。
  3.2 模型构建
  在R软件中画出路径模型图,程序如下:
  library(plspm)
  VAL <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0)
  MI <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0)
  DOP <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0)
  PRE <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0)
  GRO <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0)
  EXP <- c(1, 0, 0, 0, 0, 0, 0, 0, 0, 0)
  PER <- c(1, 1, 1, 1, 1, 1, 0, 0, 0, 0)
  SAT <- c(1, 0, 0, 0, 0, 1, 1, 0, 0, 0)
  COM <- c(1, 0, 0, 0, 0, 0, 0, 1, 0, 0)
  LOY <- c(0, 0, 0, 0, 0, 0, 0, 1, 1, 0)
  # matrix (by row binding)
  SAT_path=rbind(VAL, MI, DOP, PRE, GRO, EXP, PER, SAT, COM, LOY)
  # plot the inner matrix
  innerplot(SAT_path, box.size = 0.05, arr.pos = 0.82)
  图3为员工满意度路径模型图,图中包含10个潜变量,其中“PER”为二级潜变量,其余9个潜变量均为一级潜变量。除二级潜变量“PER”之外,其它潜变量均有至少一个显变量与之对应。
  图3 员工满意度路径模型图
  3.2结果分析
  基于上述员工满意度路径模型图,使用Patch方法对员工满意度数据进行PLS路径建模,R程序如下:
  w=read.table("f:/data8.csv",sep=",",na.strings="?",header=T)
  #下面定义的矩阵与内部关系方程中的矩阵相同
  sat.mat <- rbind(VAL, MI, DOP, PRE, GRO, EXP, PER, SAT, COM, LOY)
  #下面“A”表示显变量是反映型, “B”表示显变量是结构型
  sat.mod <- rep("A",10)
  library(plsdepot)
  MI_pca = nipals(w[, 7:8])
  MI1st = MI_pca$scores[, 1]
  DOP_pca = nipals(w[, 9:11])
  DOP1st = DOP_pca$scores[, 1]   PRE_pca = nipals(w[, 12:16])
  PRE1st = PRE_pca$scores[, 1]
  GRO_pca = nipals(w[, 17:20])
  GRO1st = GRO_pca$scores[, 1]
  #构建一个数据框,把四个潜变量的第一主成分得分插入数据框中
  w1 = cbind(w[, 1:19], MI1st, DOP1st, PRE1st, GRO1st, w[, 20:27])
  #下面语句目的是把显变量分配到与其对应的潜变量中
  sat.sets2 <- list(1:3,7:8,9:10,11:15,16:19,4:6,20:23,25:26,27:29,30:31)
  res2=plspm(w1, sat.mat, sat.sets2, sat.mod, scaled=F)
  使用语句summary(res2)可以得到一系列结果,结果包括:唯一维度检验结果、外部模型评估结果、crossloadings矩阵、相关系数表、内部模型评估结果总效应表等。
  3.21 唯一维度的检验
  除了summary(res2)语句之外,还可使用程序res2$unidim直接得到各组显变量唯一维度检验结果表。
  表1 各组显变量唯一维度检验结果
  由表1可知,各组显变量均为“反映型”,除“VAL”和“MI”两组显变量外,其它各组显变量的三大指标均满足唯一维度的要求。“VAL”和“MI”这组显变量的Cronbach’s a系数值分别为0.543、0.455,均不满足大0.7的标准。然而,Gaston Sancez(2013)认为DG’s rho是一项比Cronbach’s a系数更佳的指标,这两组显变量的DG’s rho值均大于0.7,而且第一特征值都大于1,第二特征值都小于1。因此,可以认为这两组显变量均是唯一维度的。
  3.22 外部模型结果分析
  (1)负载系数(loading)
  图4为负载系数柱状图,每组显变量的颜色各异,图形十分漂亮。其中,柱长代表显变量与其潜变量之间的负载系数值,图上方的黄线表示标准值为0.7的基准线。由图可知,“VAL2”和“PRE3”的柱长明显没有达到0.7的标准线,不满足负载系数大于0.7的标准,应该删除这两个显变量。不过,这两个变量对本文研究具有比较大的意义,故保留它们。
  (2)共同因子(Communality)
  由公式(1)可知,共同因子值等于负载系数值的平方,且标准要求大于0.5。一般情况下,只要负载系数值大于0.7,相应显变量的共同因子值必然大于0.5,可知“VAL2”和“PRE3”这两个显变量的共同因子值肯定小于0.5。不过,由表2可知,各组显变量的平均共同因子值均大于0.5,可以说明各组测量模型的预测能力都比较好。
  3.23 内部模型结果分析
  使用res2$inner_summary语句可直接得到内部模型总汇表,表中包括 “平均共同因子值”、 “R2”和“平均冗余度”等指标。
  表2 内部模型总汇表
  (1)内部模型R2
  由表2可知,外生型R2变量的拟合优度R2值均为0,五个内生变量的 值分别为0.363、0.991、0.539、0.589和0.751,四个变量的R2值大于0.5,根据Chin(1998)和 Gaston Sanchez(2013)的观点,这四个变量的内部模型具有较好的拟合效果,而变量“EXP”的内部模型仅具有一般的拟合效果。
  (2)冗余度(Redundaney)
  由公式(2)可知,外生变量的冗余度值为0,内生变量的冗余度值等于平均共同因子值和R2的乘积。冗余度值没有相应的标准,一般情况下,冗余度值越大,说明该潜变量对其显变量的预测能力越强,表示效果越好。
  3.24 路径模型结果分析
  观察基于Patch方法的路径模型结果图,如图5。
  图5 路径模型结果图
  图5中的路径系数表现了各潜变量之间的关系,这些潜变量之间的关系可以用下列回归方程表现出来。
  由公式(7)可知,员工忠诚与员工满意度和组织承诺存在极大的关系,通过一系列转换,最终把“LOY”的回归方程式写成以下形式:
  (8)
  从公式(8)可知,对“员工忠诚”影响最大的变量分别是“PRE”、“GRO”和“EXP”,其次是“DOP”、“MI”和“VAL”。因此,要提高员工忠诚必须重点关注“企业组织压力”、“组织团队”和“员工期望”三个方面。
  4 结论
  通过上述分析,本文得出以下结论:第一,PLS-PM中的Patch方法可以有效地解决多级潜变量PLS路径建模问题,并且通过分析PLS-PM相关的各项指标,发现模型结果令人满意;第二,通过分析路径模型图中的路径系数,把各潜变量之间的关系写成回归方程,发现“员工满意度”和“员工感知”之间的关系最为紧密,通过“员工满意度”和“组织承诺”对“员工忠诚”的直接和间接影响,发现“企业组织压力”、“组织团队”和“员工期望”三个变量对“员工忠诚”的影响最大。因此,要提高员工忠诚必须重点关注“企业组织压力”、“组织团队”和“员工期望”三个方面。
  参考文献
  [1]Sanchez, G. PLS Path Modeling with R [M]. Trowchez Editions.Berkeley,2013
  [2]吴喜之.复杂数据统计方法[M].北京:中国人民大学出版社会,2012:160-173.
  [3]郝冉.PLS路径建模在2007北京市诚信调查中的应用研究[D].北京:首都经贸大学,2008
  作者简介:
  周子渊(1988-),男,汉族,江西上饶,云南财经大学统计与数学学院硕士研究生,研究方向:经济统计。
  温丽媛(1989-),女,山西晋城,云南财经大学城市学院硕士研究生,研究方向:人口、资源与环境经济学。
  衷志刚(1988- ),男,江西南昌,云南财经大学统计与数学学院硕士研究生,研究方向:经济统计。
其他文献
摘 要:本文以毕志愿到西藏基层就业的在校大学生为研究对象,通过对西藏民族大学在校大学生学习“双语”现状的问卷调查情况和笔者自身的实际生活经验及相关数据分析,结合西藏基层工作人员需具备的基本素质来阐述在校大学生学好“双语”的重要性,在此基础上提出应该怎样安排学习时间,将在校学习的理论知识与自己将来要从事的实际工作有机的结合起来,做到学以致用的目的。  关键词:民族院校大学生;双语;重要性  调查对象
期刊
摘 要:“儿童是利用形式、色彩和感觉思维的。”对他们来说,看得见摸得着的东西比抽象事物更易接受。这样不仅符合儿童的年龄特点,也符合人类认知事物先感性后理性的规律。  关键词:儿童 思维 直感 认知事物 英语课堂教学 直观教学  写下这个题目,大家恐怕真的是一头雾水,不知所云,要从这“雾”里看出“花”来的确不易。那就让我看门见山,使大家能够“豁然开朗”。我的话不长,就从一堂数学课谈起。  曾听过某特
期刊
摘 要:随着爆破技术的广泛应用,其所产生的震动、空气冲击波、噪音、飞石等负面影响日益引起了人们的关注,其中爆破震动被认为是各种公害之首。爆破所产生的地震波对各种结构均有不同程度的影响,尤其是地下结构,可能出现巷道围岩失稳、支护结构失效破坏、诱发冲击矿压等严重后果。因此,研究爆破地震波对巷道围岩的影响,探讨掘进爆破巷道围岩的动力响应尤为重要,是爆破震动研究领域中的重点内容。  关键词:爆破地震波,巷
期刊
摘 要:在建筑中,给排水系统对于人民群众正常的生产生活有着十分重大的意义,进行给排水设计,应该从技术方面、安全方面、实用方面、美观方面、经济方面来进行考虑,不断地总结与完善设计技术,找到最好的给排水系统设计方案,合理地选择管材、设备、系统以及附件,满足建筑对于功能的要求,保证建筑整体能够良好地运转。  关键词:建筑;给排水;节能节水技术  1、 建筑给排水管道的设计  1.1、排水系统的选择  建
期刊
摘 要:农村公路是农村经济发展必不可少的一部分,其自身具有着特殊性。农村公路管理是一项长期而艰苦的工作,因此,我们应该对农村公路的有效管理进行思考。本文重点分析了农村公路在养护管理方面存在的问题,并且提出了建立新型农村公路管理体系的建议。  关键词:农村公路;问题;管理体系  引言  在中国这样一个农业大国,农村公路事业的发展显得更加特殊,为了加快农村的经济发展,为农村居民提供更方面的出行环境,就
期刊
摘 要:研究单缝夫琅禾费衍射条纹强度分布及各参量之间的关系是光学领域非常重要的研究内容。本文基于光的衍射理论,用Matlab软件程序实现了单缝夫琅禾费衍射中各相关参量之间的关系,并可视化不同缝宽和不同入射波长条件下的衍射条纹强度分布。  关键词:Matlab;单缝夫琅禾费衍射;衍射强度分布  1.引言  鉴于夫琅禾费单缝衍射的物理规律较为抽象、难以理解及数学表达式求解复杂、耗费时间,故利用MATL
期刊
摘 要:中小学校体育工作中明确规定大课间活动是学校体育工作基本任务,本文通过详细分析影响大课间活动的主要矛盾,提出学生参与课间操积极性的内在矛盾平衡关系,通过分析提出相应对策,为推动大课间活动管理起到了指导作用,最终促使学生更为积极主动的参与大课间活动。  关键词:大课间活动 积极性 管理 主要矛盾  1.问题的提出  大课间活动是学校体育工作的组成部分,是对体育教学的补充和延伸。学校对大课间管理
期刊
摘 要:利用高温高压页岩膨胀仪在实验室对页岩进行模拟试验研究,探讨了高温高压下页岩的膨胀规律。实验表明,页岩的膨胀率随温度的增大而迅速变大,随压力的的增高而降低,但温度的影响比压力稍大;页岩的膨胀速率随温度压力的增高而变大;一定量的页岩的膨胀量是一定的,只要时间足够长,膨胀率曲线将最终达到平稳状态。  关键词:温度;压力;页岩;膨胀率;影响  钻井作业中所钻遇的地层70%为泥页岩,约90%的井壁不
期刊
摘 要:通过测定不同粒径下高性能水泥的抗压强度,并研究了加入水泥的质量对其抗压强度的影响。结果表明:在加水量250ml、加沙量1500ml保持不变的情况下,加入粒径为75um水泥熟料550 g时,其抗压强度达到最大,同时,28d的抗压强度大于7d的抗压强度。水泥的粒径在水化活性和堆积密度两个方面影响水泥的相关性能粒径为50um的水泥熟料,其抗压强度高于粒径为20um、30um、40um的水泥熟料,
期刊
摘 要:以提高医疗/护理管理质量,加强质量管控来获得和保持良好的社会和经济效益,已成为医院发展的根本方向,更是临床科室生存发展的保证。本文通过近三年来消化内科工作过程,从医疗/护理质量管理及质量控制措施及其重要性方面进行总结阐述,以利于与同行相互学习,探讨管理方法交流工作经验,更好提高医疗/护理服务质量。  关键词:医疗质量; 医疗质量管理; 医疗质量控制; 消化内科  中图分类号: F123.1
期刊