论文部分内容阅读
[摘 要]本文以基尼系数代表贫富差距水平,以GDP代表经济水平,运用spearman相关系数分析各国贫富差距与经济水平的关系,而后又运用聚类分析探究不同国家国力发展上的异同点。
[关键词] 基尼指数 Spearman秩相关系数 聚类分析
一、研究背景
近年来,随着世界一体化、全球经济竞争加剧,以及科技的逐步发展,世界各国的贫富差距正在逐渐扩大。在世界上出现社会主义和资本主义两大阵营之后,经济发展的主要特征是财富越来越集中到少数人手里。世界上最富的20%的人群和最穷的20%的人群相比,1946年的收入差距是46倍,1990年是60倍,而如今更是达到了86倍。
因此,找到一种方式来衡量贫富差距,从而检验贫富差距是否与经济水平相关,对帮助各国寻求发展经济的同时缩小贫富差距的方法具有重大意义。本文通过非参数方法以及系统聚类方法,寻找贫富差距与经济水平之间的关系,探求不同国家在经济水平和贫富差距上的共性和区别,以期为各国发展提供理论性的帮助。
二、研究方法
1.指标介绍
基尼系数(Gini coefficient),是20世纪初意大利经济学家基尼(Corrado Gini)根据劳伦茨曲线所定义的判断收入分配公平程度的指标。由劳伦茨曲线本身导出的基尼系数的定义非常简单(见图1):
设上图中的实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B。并以A除以A+B的商表示不平等程度。这个数值被称为“基尼系数”或“劳伦茨系数”。如果A为零,即基尼系数为零,表示收入分配完全平等(红色线和绿色线成一条线);如果B为零则系数为1,收入分配绝对不平等(红色线在蓝色线之上)。该系数可在零和1之间取任何值。收入分配越是趋向平等,劳伦茨曲线的弧度越小(越是成为45度),基尼系数也越小,反之,收入分配越是趋向不平等,劳伦茨曲线的弧度越大,那么基尼系数也越大。如果税收调节(如通过个人所得税)能使收入均等化,那么,基尼系数即会变小。因此,只要有劳伦茨曲线图表,就可以用一式求出基尼系数。
2.检验分析方法
(1)Spearman相关系数检验
Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求。其计算方法如下:
设有成对数据,用在中的秩和在中的秩分别代替和,构造新的成对数据。之后计算这些秩成对数据的Pearson矩相关系数
(2) 聚类分析(cluster analysis)
聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性;而聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。在本例中,我们采用系统聚类法对数据进行处理。
系统聚类法的基本思想是:距离相近的样本先归为一类,距离较远的后聚成一类,过程一直进行下去,直至每个样本都聚到合适的类中为止。而用于度量这样的“距离”的方式有欧氏距离、欧氏距离平方、切比雪夫距离、明可夫斯基距离等。在本文中,我们将采用欧氏距离平方作为度量样本之间距离的方式。其计算公式为:
三、分析过程
1.spearman相关系数检验
(1)检验过程及结果
设成对数据(GDP,基尼指数)为独立同分布的样本(xi , yi);记各国GDP和基尼指数在所有样本中的秩分别为Ri,Qi,对所有数据按从小到大排秩,得到2表。
将数据输入Minitab,计算得出其秩相关系数为-0.052,而P值为0.704。因此接受原假设:认为基尼指数与GDP无明显相关关系。
(2)贫富差距与经济发展水平的相关性结论
为了更清楚地把握基尼指数与GDP的关系,做两者的散点图如下:
由散点图上可以看出,基尼指数与GDP之间呈微弱的负相关关系。造成基尼指数与GDP未呈现明显负相关关系的原因有两点:一是美国在图中呈现出异常点的状况(图中最右端的点);二是部分GDP较低的国家,其基尼指数也较低(图中左下角)。
2.聚类分析
(1) 聚类分析结果
将56个国家的基尼指数和GDP值输入SPSS,得到以下聚类结果表3。
(2)按贫富差距和收入水平聚类后的结论
第Ⅰ类的美国和第Ⅱ类的日本都属于国民收入水平很高的国家,均属于高度发达水平;但两者成为不同的两类的根本原因是美国基尼指数较高,而日本则拥有较低的基尼指数。
第Ⅲ类的国家同属于GDP较高的国家,都属于传统意义上的大国。但第Ⅲ类的国家内部也有细微差别。德国属于GDP较高、收入分配较为理想的国家,而中国则在收入分配上相对极端——基尼指数达到了47。而其他三个国家则拥有较为温和的基尼指数。
第Ⅳ类国家都属于发达国家或发展中国家上游国家,体现为GDP指数较高。但值得注意的是,这类国家的基尼指数也普遍较高,这可能是因为它们在追求高GDP的过程中忽略了收入分配的公平性所致。
第Ⅴ类国家代表着GDP相对较低的国家。由于此处使用的是GDP而不是人均GDP,因此部分发达国家由于人口较少,绝对生产力较低而被归入此类。但第Ⅴ类中的绝大部分国家还是屬于发展相对落后的国家。它们的基尼指数各异,对这种现象的解释在散点图部分已提到,此处不再赘述。
四、结论
通过聚类分析,本文将世界主要56国分为了五类,各类别中的国家都拥有一定的共性。这样的分类结果对于帮助各国缩小贫富差距,发展经济和综合国力有一定的借鉴意义。
参考文献:
[1] 陈昌兵:各地区居民收入基尼系数计算及其非参数计量模型分析.[J].数量经济技术经济研究.2007(1)
[2] 王轶群:27个主要亚洲国家贫富差距与经济水平探究.[J].学术论丛.2008(11)
[3] 张筱莉:对世界500强企业发展水平的统计分析.[J].统计教育.2007(12)
[关键词] 基尼指数 Spearman秩相关系数 聚类分析
一、研究背景
近年来,随着世界一体化、全球经济竞争加剧,以及科技的逐步发展,世界各国的贫富差距正在逐渐扩大。在世界上出现社会主义和资本主义两大阵营之后,经济发展的主要特征是财富越来越集中到少数人手里。世界上最富的20%的人群和最穷的20%的人群相比,1946年的收入差距是46倍,1990年是60倍,而如今更是达到了86倍。
因此,找到一种方式来衡量贫富差距,从而检验贫富差距是否与经济水平相关,对帮助各国寻求发展经济的同时缩小贫富差距的方法具有重大意义。本文通过非参数方法以及系统聚类方法,寻找贫富差距与经济水平之间的关系,探求不同国家在经济水平和贫富差距上的共性和区别,以期为各国发展提供理论性的帮助。
二、研究方法
1.指标介绍
基尼系数(Gini coefficient),是20世纪初意大利经济学家基尼(Corrado Gini)根据劳伦茨曲线所定义的判断收入分配公平程度的指标。由劳伦茨曲线本身导出的基尼系数的定义非常简单(见图1):
设上图中的实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B。并以A除以A+B的商表示不平等程度。这个数值被称为“基尼系数”或“劳伦茨系数”。如果A为零,即基尼系数为零,表示收入分配完全平等(红色线和绿色线成一条线);如果B为零则系数为1,收入分配绝对不平等(红色线在蓝色线之上)。该系数可在零和1之间取任何值。收入分配越是趋向平等,劳伦茨曲线的弧度越小(越是成为45度),基尼系数也越小,反之,收入分配越是趋向不平等,劳伦茨曲线的弧度越大,那么基尼系数也越大。如果税收调节(如通过个人所得税)能使收入均等化,那么,基尼系数即会变小。因此,只要有劳伦茨曲线图表,就可以用一式求出基尼系数。
2.检验分析方法
(1)Spearman相关系数检验
Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求。其计算方法如下:
设有成对数据,用在中的秩和在中的秩分别代替和,构造新的成对数据。之后计算这些秩成对数据的Pearson矩相关系数
(2) 聚类分析(cluster analysis)
聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性;而聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。在本例中,我们采用系统聚类法对数据进行处理。
系统聚类法的基本思想是:距离相近的样本先归为一类,距离较远的后聚成一类,过程一直进行下去,直至每个样本都聚到合适的类中为止。而用于度量这样的“距离”的方式有欧氏距离、欧氏距离平方、切比雪夫距离、明可夫斯基距离等。在本文中,我们将采用欧氏距离平方作为度量样本之间距离的方式。其计算公式为:
三、分析过程
1.spearman相关系数检验
(1)检验过程及结果
设成对数据(GDP,基尼指数)为独立同分布的样本(xi , yi);记各国GDP和基尼指数在所有样本中的秩分别为Ri,Qi,对所有数据按从小到大排秩,得到2表。
将数据输入Minitab,计算得出其秩相关系数为-0.052,而P值为0.704。因此接受原假设:认为基尼指数与GDP无明显相关关系。
(2)贫富差距与经济发展水平的相关性结论
为了更清楚地把握基尼指数与GDP的关系,做两者的散点图如下:
由散点图上可以看出,基尼指数与GDP之间呈微弱的负相关关系。造成基尼指数与GDP未呈现明显负相关关系的原因有两点:一是美国在图中呈现出异常点的状况(图中最右端的点);二是部分GDP较低的国家,其基尼指数也较低(图中左下角)。
2.聚类分析
(1) 聚类分析结果
将56个国家的基尼指数和GDP值输入SPSS,得到以下聚类结果表3。
(2)按贫富差距和收入水平聚类后的结论
第Ⅰ类的美国和第Ⅱ类的日本都属于国民收入水平很高的国家,均属于高度发达水平;但两者成为不同的两类的根本原因是美国基尼指数较高,而日本则拥有较低的基尼指数。
第Ⅲ类的国家同属于GDP较高的国家,都属于传统意义上的大国。但第Ⅲ类的国家内部也有细微差别。德国属于GDP较高、收入分配较为理想的国家,而中国则在收入分配上相对极端——基尼指数达到了47。而其他三个国家则拥有较为温和的基尼指数。
第Ⅳ类国家都属于发达国家或发展中国家上游国家,体现为GDP指数较高。但值得注意的是,这类国家的基尼指数也普遍较高,这可能是因为它们在追求高GDP的过程中忽略了收入分配的公平性所致。
第Ⅴ类国家代表着GDP相对较低的国家。由于此处使用的是GDP而不是人均GDP,因此部分发达国家由于人口较少,绝对生产力较低而被归入此类。但第Ⅴ类中的绝大部分国家还是屬于发展相对落后的国家。它们的基尼指数各异,对这种现象的解释在散点图部分已提到,此处不再赘述。
四、结论
通过聚类分析,本文将世界主要56国分为了五类,各类别中的国家都拥有一定的共性。这样的分类结果对于帮助各国缩小贫富差距,发展经济和综合国力有一定的借鉴意义。
参考文献:
[1] 陈昌兵:各地区居民收入基尼系数计算及其非参数计量模型分析.[J].数量经济技术经济研究.2007(1)
[2] 王轶群:27个主要亚洲国家贫富差距与经济水平探究.[J].学术论丛.2008(11)
[3] 张筱莉:对世界500强企业发展水平的统计分析.[J].统计教育.2007(12)