论文部分内容阅读
摘 要:文章针对学生素质考核,基于审计学考核体系,提出了一种主成分分析模型的赋权方法——还原法。相较于传统主成分分析模型以方差贡献度为权重的不合理性,还原法PCA模型在保留了主成分分析模型的降维思想的基础上,结合考核体系,重新设置权重。该模型通过识别各个主成分模型中对应系数较大的二级指标,将其还原至考核体系,查找对应的分值,以确定权重。为确保权重确定的合理性,文章通过算例对其加以检验。
关键词:审计学考核体系;还原法PCA模型;权重
1引言
本文提出了适用于综合素质考核的还原法PCA模型。该模型是在考虑原指标权重的基础上进行分析的,将提取出的主成分还原到考核指标,查找其对应的分值,以确定权重,并计算出学生的主成分综合得分,根据得分进行排名。区别于传统的PCA模型和其他的赋权法PCA模型,文章提出的还原法PCA模型,既确保了权重确定的合理性又简化了权重的确立步骤。
2传统主成分分析模型
在解决实际问题的过程中,研究者为了对研究对象有一个全面综合的认识,往往会搜集尽可能多的信息,但是由于现有理论和技术的局限性,过多变量非但无法被充分利用,反而成了分析和解决问题的障碍,为解决这一问题统计学家Karl Pearson提出了主成分分析。主成分分析是运用降维的思想,在保证原信息损失尽可能少的前提下,将多指标简化为少量综合指标,用少数变量尽可能多的反映原变量的信息的一种统计分析方法,以起到降维的目的,并使高维数据点的可见性成为可能。
采用新变量PC1来替代原来p个变量X1,X2,…XP时, PC1应尽可能多的反映原变量信息,如果第一主成分不足以代表原变量的绝大部分信息,考虑引入第二主成分PC2,依次类推。主成分分析的主要目的就是简化数据,因此在实际应用中不会取p个主成分,通常选用m(m<p)个主成分。主成分个数m要依据各个主成分累计方差贡献率来最终判定。
在主成分分析中,通常是用方差贡献率作为权重来计算综合得分。方差累计贡献率计算公式:
主成分对应的特征值:m为选定的主成分数;p为全部主成分数。
2.2对PCA中以累计方差贡献度为权重的方法的质疑
上海财经大学统计系王学民教授在《对主成分分析中综合得分方法的质疑》一文中指出,“该方法粗看起来似乎有一定道理且很有吸引力,但仔细推敲之后就会发现这一方法是对主成分思想和方法的误解,是不科学的,没有什么理论和应用上的价值,该综合排名方法在我国的多元数据分析应用中已得到了比较普遍的误用。”
2.3 PCA-组合赋权法权重的确定
基于以累计方差贡献率为权重计算综合得分的不合理性,近年来,不少统计学专家和学者陆续提出了一些改进方法,如引入熵值法,形成一个新的组合赋权方法;结合层次分析法进行类加权主成分分析。他们的研究为文章提供了理论依据和方法基础,但现有文献在确定权重的方法上,往往过于冗杂,不利于主成分分析在其他学科领域的推广和使用。文章在现有文献的基础上,针对考核体系,提出了一套适用于考核体系的权重确定方法,并将其应用于审计学考核体系中,以分析某高校财务管理学生专业的成绩。
3还原法PCA模型
传统的主成分分析模型是以该主因子的方差贡献度为权重进行加权平均的,而忽略了主成分分析的实际意义。因此,文章在考虑原指标权重的基础上建立新的主成分分析模型。在确定主成分个数后,识别各个主成分模型中对应系数较大的二级指标,将提取出的二级指标还原到考核体系,查找其在考核体系中所占的分值qj。文章所用到的审计学考核体系如表1所示,该考核体系是根据会计人员能力框架,从理论、实践和笔试三个方面,共计十三个指标对学生进行考核的,以保证考核方式的科学性和全面性。
具体赋权方式如下:在确定各个主成分中系数较大的二级指标后,根据式(5)计算出指标在考核体系中对应的分值的总和pk;根据式(6),计算出m个主成分对应的权重pk;根据式(7),以pk为各个主成分的权重进行加权平均,计算出综合得分Q以及综合得分排名。
数据的无量纲化处理主要有两种方式,分别为标准化处理和均值化处理,文章所用到的全部数据均采用均值化处理。在进行均值化处理时,设原始数据为 ,该指标均值为
Step2:剔除不相关因子
主成分分析的原理是通过提取相关因子的信息,形成新的主因子,反映各组因子的共性,因此选用主成分分析的前提是各因子之间存在着较大的相关性。文章对学生各项成绩指标进行相关性分析,剔除与其他因子相关性不强的因子,确保主成分分析的效果(由于考核指标和考核方式的局限性,导致
这3个指标内部数值都相等,无法做相关性分析,故将其剔除)。结果显示,在显著性水平为0.05的条件下,
4.2 赋权法主成分分析模型的建立
主成分分析模型是在对原始因子提取共性,在形成少数个综合了大部分信息的主因子的基础上,分别对这几个主因子下学生成绩的得分进行累加,得到每个主因子的总得分,即该主因子的贡献度,以主因子的贡献度为权重,计算出主因子综合得分的模型。
Step1: 提取主成分
表2中特征根大于0.75的主因子为前3个,累积方差贡献率达到81.826%,综合了品质的大部分信息说明了提取4个主因子较为合适。
表2 解释的总方差
Step2: 建立主成分系数矩阵
对因子分析模块运行结果进行调整,具体操作过程如下:分别将因子载荷矩阵的第i列的每个元素aij(1≤i≤7,1≤j≤4)除以第i个特征值的平方根 ,得到主成分系數矩阵中的各个元素bij(1≤i≤7,1≤j≤4),建立的主成分系数矩阵A。写出各个主成分的原始变量表达式(9)、式(10)、式(11)、式(12)。 Step3: 主成分的解释
第一个主成分中,几乎所有指标和PC1都有着一定的正相关性,结合考核体系说明PC1主要反映了学生的整体素质;第二个主成分中,u1、u2这两个指标和PC2有较强的正相关性,结合考核体系说明PC2主要反映了学生的逻辑思维能力、分析能力和沟通能力;第三个主成分中,v4、w1这两个指标和PC3有较强的正相关性,结合考核体系,这两个指标分别对应了学生的团队合作能力与灵活运用能力;第四个主成分中,u2和PC4有较强的正相关性,结合考核体系说明PC4主要反映了学生的沟通能力和参与度。
Step4: 权重的确定
在传统的主成分分析模型中,是以该主因子的方差贡献度为权重进行加权平均的,而忽略了主成分分析的实际意义,因此,在考虑原指标权重的基础上进行新主成分分析模型的建立,找出每个主因子在考核体系中所占的比重,将提取出的主因子还原到考核指标,计算出综合得分,得到赋权法主成分分析模型。
4.3 基于赋权法主成分分析模型的成绩评价
为比较学生各项素质的优劣,文章分别对学生的各个主成分得分,综合得分以及原始得分进行排名(见附录)。通过比较原始排名和综合得分排名可以直观地看出,二者大体一致,说明文章提出的这种赋权方法计算出的综合得分在客观上符合审计学考核体系的要求,能在一定程度上反映学生的综合素质。由于学生人数较多,文章抽取两个较为典型学生的成绩进行分析:①财管专业31号的学生,综合得分排名与原始排名都是第一,但其第二主成分与第四主成分都排在最后一名,说明该生的团队合作能力与沟通能力较为欠缺;②财管专业44号的学生,原始排名在前5名,但综合得分排名为第十,究其原因是该生在第二、三主成分的得分较低,尤其是第三主成分排到了四十开外,说明该生的团队合作能力与灵活运用能力相对不足,而传统的加权平均法并未反映该现象。
5 研究结论
文章针对学生综合素质考核体系,提出了还原法PCA模型。该模型结合了考核体系,通过识别各个主成分模型中对应系数较大的二级指标,将其还原至考核体系,查找对应的分值,以确定权重。在算例部分,通過比较原始排名和综合得分排名可以直观地看出,二者大体一致,说明文章提出的这种赋权方法计算出的综合得分在客观上符合审计学考核体系的要求。
还原法较文献综述中提到的熵值法和层次分析法等赋权方法而言,简化了权重确立的步骤,且能在一定程度上反映学生各方面的能力。关于三种赋权方法效果的比较分析,文章会将其作为今后的课题讨论。
参考文献
[1]杨园.基于多元统计分析的学生综合素质评价[D].北京:清华大学,2013.
[2]王学民.对主成分分析中综合得分方法的质疑[J].统计与决策,2007, 23(08):31-32.
[3]何晓群.多元统计分析[M].北京:中国人民大学出版社,2012:123-125.
[4]杨宁雪.基于PCA 的大学生综合素质评价研究[D].武汉:武汉科技大学,2007.
[5]公丽艳.基于主成分与聚类分析的苹果加工品质评价[J].农业工程学报,2014,30(13):276.
[6]孙晓东,田澎.类加权主成分分析在企业物流绩效评价中的应用[J].工业工程与管理,2007,12(01):57.
[7]王琼,卢聪.基于主成分分析和熵权法的河流生境质量评价方法[J].生态科学,2017,36(4):185.
关键词:审计学考核体系;还原法PCA模型;权重
1引言
本文提出了适用于综合素质考核的还原法PCA模型。该模型是在考虑原指标权重的基础上进行分析的,将提取出的主成分还原到考核指标,查找其对应的分值,以确定权重,并计算出学生的主成分综合得分,根据得分进行排名。区别于传统的PCA模型和其他的赋权法PCA模型,文章提出的还原法PCA模型,既确保了权重确定的合理性又简化了权重的确立步骤。
2传统主成分分析模型
在解决实际问题的过程中,研究者为了对研究对象有一个全面综合的认识,往往会搜集尽可能多的信息,但是由于现有理论和技术的局限性,过多变量非但无法被充分利用,反而成了分析和解决问题的障碍,为解决这一问题统计学家Karl Pearson提出了主成分分析。主成分分析是运用降维的思想,在保证原信息损失尽可能少的前提下,将多指标简化为少量综合指标,用少数变量尽可能多的反映原变量的信息的一种统计分析方法,以起到降维的目的,并使高维数据点的可见性成为可能。
采用新变量PC1来替代原来p个变量X1,X2,…XP时, PC1应尽可能多的反映原变量信息,如果第一主成分不足以代表原变量的绝大部分信息,考虑引入第二主成分PC2,依次类推。主成分分析的主要目的就是简化数据,因此在实际应用中不会取p个主成分,通常选用m(m<p)个主成分。主成分个数m要依据各个主成分累计方差贡献率来最终判定。
在主成分分析中,通常是用方差贡献率作为权重来计算综合得分。方差累计贡献率计算公式:
主成分对应的特征值:m为选定的主成分数;p为全部主成分数。
2.2对PCA中以累计方差贡献度为权重的方法的质疑
上海财经大学统计系王学民教授在《对主成分分析中综合得分方法的质疑》一文中指出,“该方法粗看起来似乎有一定道理且很有吸引力,但仔细推敲之后就会发现这一方法是对主成分思想和方法的误解,是不科学的,没有什么理论和应用上的价值,该综合排名方法在我国的多元数据分析应用中已得到了比较普遍的误用。”
2.3 PCA-组合赋权法权重的确定
基于以累计方差贡献率为权重计算综合得分的不合理性,近年来,不少统计学专家和学者陆续提出了一些改进方法,如引入熵值法,形成一个新的组合赋权方法;结合层次分析法进行类加权主成分分析。他们的研究为文章提供了理论依据和方法基础,但现有文献在确定权重的方法上,往往过于冗杂,不利于主成分分析在其他学科领域的推广和使用。文章在现有文献的基础上,针对考核体系,提出了一套适用于考核体系的权重确定方法,并将其应用于审计学考核体系中,以分析某高校财务管理学生专业的成绩。
3还原法PCA模型
传统的主成分分析模型是以该主因子的方差贡献度为权重进行加权平均的,而忽略了主成分分析的实际意义。因此,文章在考虑原指标权重的基础上建立新的主成分分析模型。在确定主成分个数后,识别各个主成分模型中对应系数较大的二级指标,将提取出的二级指标还原到考核体系,查找其在考核体系中所占的分值qj。文章所用到的审计学考核体系如表1所示,该考核体系是根据会计人员能力框架,从理论、实践和笔试三个方面,共计十三个指标对学生进行考核的,以保证考核方式的科学性和全面性。
具体赋权方式如下:在确定各个主成分中系数较大的二级指标后,根据式(5)计算出指标在考核体系中对应的分值的总和pk;根据式(6),计算出m个主成分对应的权重pk;根据式(7),以pk为各个主成分的权重进行加权平均,计算出综合得分Q以及综合得分排名。
数据的无量纲化处理主要有两种方式,分别为标准化处理和均值化处理,文章所用到的全部数据均采用均值化处理。在进行均值化处理时,设原始数据为 ,该指标均值为
Step2:剔除不相关因子
主成分分析的原理是通过提取相关因子的信息,形成新的主因子,反映各组因子的共性,因此选用主成分分析的前提是各因子之间存在着较大的相关性。文章对学生各项成绩指标进行相关性分析,剔除与其他因子相关性不强的因子,确保主成分分析的效果(由于考核指标和考核方式的局限性,导致
这3个指标内部数值都相等,无法做相关性分析,故将其剔除)。结果显示,在显著性水平为0.05的条件下,
4.2 赋权法主成分分析模型的建立
主成分分析模型是在对原始因子提取共性,在形成少数个综合了大部分信息的主因子的基础上,分别对这几个主因子下学生成绩的得分进行累加,得到每个主因子的总得分,即该主因子的贡献度,以主因子的贡献度为权重,计算出主因子综合得分的模型。
Step1: 提取主成分
表2中特征根大于0.75的主因子为前3个,累积方差贡献率达到81.826%,综合了品质的大部分信息说明了提取4个主因子较为合适。
表2 解释的总方差
Step2: 建立主成分系数矩阵
对因子分析模块运行结果进行调整,具体操作过程如下:分别将因子载荷矩阵的第i列的每个元素aij(1≤i≤7,1≤j≤4)除以第i个特征值的平方根 ,得到主成分系數矩阵中的各个元素bij(1≤i≤7,1≤j≤4),建立的主成分系数矩阵A。写出各个主成分的原始变量表达式(9)、式(10)、式(11)、式(12)。 Step3: 主成分的解释
第一个主成分中,几乎所有指标和PC1都有着一定的正相关性,结合考核体系说明PC1主要反映了学生的整体素质;第二个主成分中,u1、u2这两个指标和PC2有较强的正相关性,结合考核体系说明PC2主要反映了学生的逻辑思维能力、分析能力和沟通能力;第三个主成分中,v4、w1这两个指标和PC3有较强的正相关性,结合考核体系,这两个指标分别对应了学生的团队合作能力与灵活运用能力;第四个主成分中,u2和PC4有较强的正相关性,结合考核体系说明PC4主要反映了学生的沟通能力和参与度。
Step4: 权重的确定
在传统的主成分分析模型中,是以该主因子的方差贡献度为权重进行加权平均的,而忽略了主成分分析的实际意义,因此,在考虑原指标权重的基础上进行新主成分分析模型的建立,找出每个主因子在考核体系中所占的比重,将提取出的主因子还原到考核指标,计算出综合得分,得到赋权法主成分分析模型。
4.3 基于赋权法主成分分析模型的成绩评价
为比较学生各项素质的优劣,文章分别对学生的各个主成分得分,综合得分以及原始得分进行排名(见附录)。通过比较原始排名和综合得分排名可以直观地看出,二者大体一致,说明文章提出的这种赋权方法计算出的综合得分在客观上符合审计学考核体系的要求,能在一定程度上反映学生的综合素质。由于学生人数较多,文章抽取两个较为典型学生的成绩进行分析:①财管专业31号的学生,综合得分排名与原始排名都是第一,但其第二主成分与第四主成分都排在最后一名,说明该生的团队合作能力与沟通能力较为欠缺;②财管专业44号的学生,原始排名在前5名,但综合得分排名为第十,究其原因是该生在第二、三主成分的得分较低,尤其是第三主成分排到了四十开外,说明该生的团队合作能力与灵活运用能力相对不足,而传统的加权平均法并未反映该现象。
5 研究结论
文章针对学生综合素质考核体系,提出了还原法PCA模型。该模型结合了考核体系,通过识别各个主成分模型中对应系数较大的二级指标,将其还原至考核体系,查找对应的分值,以确定权重。在算例部分,通過比较原始排名和综合得分排名可以直观地看出,二者大体一致,说明文章提出的这种赋权方法计算出的综合得分在客观上符合审计学考核体系的要求。
还原法较文献综述中提到的熵值法和层次分析法等赋权方法而言,简化了权重确立的步骤,且能在一定程度上反映学生各方面的能力。关于三种赋权方法效果的比较分析,文章会将其作为今后的课题讨论。
参考文献
[1]杨园.基于多元统计分析的学生综合素质评价[D].北京:清华大学,2013.
[2]王学民.对主成分分析中综合得分方法的质疑[J].统计与决策,2007, 23(08):31-32.
[3]何晓群.多元统计分析[M].北京:中国人民大学出版社,2012:123-125.
[4]杨宁雪.基于PCA 的大学生综合素质评价研究[D].武汉:武汉科技大学,2007.
[5]公丽艳.基于主成分与聚类分析的苹果加工品质评价[J].农业工程学报,2014,30(13):276.
[6]孙晓东,田澎.类加权主成分分析在企业物流绩效评价中的应用[J].工业工程与管理,2007,12(01):57.
[7]王琼,卢聪.基于主成分分析和熵权法的河流生境质量评价方法[J].生态科学,2017,36(4):185.