论文部分内容阅读
摘 要:由于经济基础、自然资源、地理条件等诸多因素的影响,广西不同城市的经济发展水平存在较大差异。正确认识这些差异,从而制定合适的政策去协调区域发展,形成区域合力,对保持全区经济可持续、平衡协调的增长具有重要意义。因此,根据广西统计局发布的2017年广西各市社会经济主要指标及其数据,利用指标聚类筛选出衡量城市社会经济发展水平的4大类共16个指标,对广西14个城市的发展水平进行聚类分析,进而研究廣西各城市的分类情况以及发展水平上的异同点,按发展水平对广西各城市进行分类,从而认识差异,为未来的经济布局提供参考。
关键词:广西;各城市;经济发展水平;聚类分析;城市竞争力
中图分类号:F127 文献标志码:A 文章编号:1673-291X(2021)14-0041-05
引言
聚类分析[1]是多元统计分析的一种,其核心思想是将每个样品看成p维空间的一个点,n个样品组成p维空间的n个点。通过定义各点之间的距离来衡量各样品之间的相似程度。距离近的点归为一类,距离远的点属于不同的类。聚类分析可以分为Q型聚类(样本聚类)和R型聚类(指标聚类)两种。聚类过程中常用的距离有欧氏距离、绝对值(cityblock)距离、马氏(Mahalanobis)距离等,常用的聚类方法有系统聚类法、动态聚类法和模糊K均值聚类法等。聚类分析能找到具有相似性的同类样品,也能够发现具有相异性的不同类样品。
近年来,城市竞争力已成为国际性的热点问题。国内关于这个问题的研究主要有:何添锦[2]阐述了当今国内外城市竞争力的研究现状,并对国内城市竞争力研究现状进行了评析,指出尚待深入研究的内容。李文军[3]运用主成分分析方法和聚类分析方法,对山东省17个地级市的经济发展情况做出综合评价,分析了各市在山东省中的经济地位。蔺兆荣[4]以2016年数据为依据,运用主成分分析法对武汉城市圈各城市竞争力进行评价。
目前,广西经济正在迅速发展,人民生活水平不断提高,但是由于经济基础、自然资源、地理条件等诸多因素的影响,广西不同城市的经济发展水平仍存在较大差异。正确的认识这些差异,从而制定合适的政策去协调区域发展,形成区域合力,对保持全区经济可持续、平衡协调的增长具有重要意义。根据广西统计局发布的2018年广西统计年鉴中的广西各市社会经济主要指标(2017年),对广西14个城市的社会经济发展状况进行聚类分析,可以按发展水平对广西各城市进行分类,从而认识差异,为未来的经济布局提供参考。
一、数据处理方法及过程
(一)指标的R型聚类
为全面分析广西各市的社会经济状况,对广西统计年鉴中的数据进行了简单的选取和加工,得到了2017年广西14个城市的4大类共33个指标。
由于选取的指标较多,指标之间可能存在较强相关性,导致其影响被放大。因此,先对33个指标按照其相关性进行R型聚类,再从每个类中选取具有代表性的指标。其步骤如下:
(1)计算各指标间的相关系数rij;
(2)定义各指标间的距离为dij=1-│rij│;
(3)按类平均法对指标进行聚类。
得到聚类图如图1。
依据距离情况考虑将指标分为16类,分类情况为:
1)农村居民人均可支配收入、农村居民人均生活费支出、城镇居民人均可支配收入;
2)每万人卫生机构床位数、每万人卫生机构人员数、每万人民用汽车拥有量;
3)地区生产总值、固定资产投资、公共财政预算收入、公共财政预算支出、互联网用户数在总人口中占比、社会消费品零售总额;
4)第一产业在地区生产总值中占比、工业总产值;
5)每万人工业企业单位、人均地区生产总值、城镇居民人均生活消费性支出;
6)常用耕地面积、农副产品总产量;
7)普通中小学平均学生数、每万人普通中小学学校数、普通中小学平均教师数;
8)第二产业在地区生产总值中占比、第三产业在地区生产总值中占比;
9)普通高等学校平均专任教师数、普通高等学校平均在校学生数。
以上9类指标因为具有较强相关性被聚为一类,其余未列出的指标单独作为一类。根据聚类的结果,结合全面性、客观性、实用性、独立性这四个原则,最后选择了4大类16个指标,如表2。
(二)样本的Q型聚类
由于各指标的量纲、量级、均值等方面存在较大差异,所以需要先对数据进行标准化处理,方法是将各指标的观察值减去该指标的平均数,然后除以该指标的标准差。其公式如下:
经标准化的数据都是没有单位的纯数量,取值范围在[-1,1]之间,且满足均值为0,标准差为1。
接下来,利用标准化处理后的指标对广西各城市进行聚类分析,取欧式距离,按类平均法聚类,得到聚类图如图2。
若将广西14个城市分为3类,得到的第一类城市为南宁市、柳州市和桂林市,第二类为北海市和防城港市,第三类为梧州市、钦州市、贵港市、玉林市、百色市、贺州市、河池市、来宾市、崇左市。
若分为4类,则第一类为南宁市,第二类为柳州市和桂林市,第三类为北海市和防城港市,第四类为梧州市、钦州市、贵港市、玉林市、百色市、贺州市、河池市、来宾市、崇左市。
若分为5类,则第一类为南宁市,第二类为柳州市和桂林市,第三类为北海市和防城港市,第四类为贵港市和玉林市,第五类为梧州市、钦州市、百色市、贺州市、河池市、来宾市、崇左市。
如果按城市规模、经济规模、公共事业发展水平、居民生活水平四大类指标分别进行聚类分析,可将各个城市分为5类,得到聚类图如图3,分类方法如表3。 二、结果的分析与讨论
从广西各城市按筛选出的全部16个指标的聚类结果来看,南宁市除了分3类时与桂林市和柳州市聚在一类,另外2次聚类均单独作为一类,说明南宁市在社会经济发展水平上与各城市存在较大差距。在所选的16个指标中,南宁市有7个指标全自治区最高,其中“户籍人口数”、“地区生产总值”、“每万人普通高等学校数”、“每万人民用汽车数”分别是全区平均值的1.9倍、2.8倍、3.4倍、2倍,可见,南宁作为省会城市,在社会经济发展水平上大幅度领先于区内其他城市。
桂林市和柳州市在按全部指標聚类时始终归为一类,表明两市的社会经济发展水平比较接近。从指标值来看,两市的绝大部分指标都达到或超过全区平均值,发展水平与南宁市较为接近,领先于广西其他城市。但是两市的优势并不相同,柳州市的“工业总产值”和“人均生活消费性支出”两个指标全区最高,其中“工业总产值”是全区平均值的2.7倍。桂林市的“每万人卫生机构数”这一指标全区第一,是平均值的1.6倍。两座城市的弱势相同,“进出口总额”都比较少,桂林市只有全区平均值的四分之一,柳州市作为一座工业城市,“进出口总额”仅为全区平均值的三分之二,说明两市在对外贸易上的开放都还不足。两市“每万人普通中小学学校数”也都比较少,只到全区平均值的一半,与其社会经济发展水平不匹配,可能导致两市居民在中小学教育上出现一定程度的入学难问题。
北海市和防城港市始终被聚为一类,从指标来看,主要是两者同为海港城市,城市规模都比较小。在城市规模的4个指标中,北海市“行政区域土地面积”全区倒数第一,防城港市倒数第二,分别是全区平均值的24%和36%;防城港市的“户籍年末总人口”和“常用耕地面积”全区倒数第一,北海市倒数第二,都远低于全区平均水平。两市的经济规模相近,北海市工业产值较高,防城港市则在进出口方面高于全区平均水平,两市居民生活水平的各指标都略高于区平均水平。
广西其他城市的社会经济发展水平大致相当,细分为5类时,玉林市和贵港市两市被聚为一类,两市地理位置接近,社会经济发展水平也比较接近,都具有人口较多、公路网发达的优势,但是高教水平发展都比较低。截至2018年,玉林市作为一个有700万户籍人口的城市,仅有一所高校;贵港市有500多万户籍人口,一所高校都没有。
从按4大类指标分别聚类的结果来看,南宁市社会经济发展水平较高,柳州市和桂林市相对比较均衡,而其他各城市则都存在一定程度的问题,广西各城市的社会经济发展状况呈现出一极两强众弱的金字塔结构。南宁市目前仍然没有辐射出具有较高发展水平的城市圈,区内发展较好的柳州市和桂林市在地理位置上与南宁市间隔较远,联系不够密切,自身的向外辐射效应也不明显。所以,广西要想在经济上取得更进一步的发展,还是要立足于以现有的发展水平较高的强市为中心,积极探索建设城市间相互联动的经济区和经济带,形成以点带面的效应,增加具有一定社会经济发展水平的区内二线城市的数量,这是在未来经济布局中需要考虑的发展方向。
参考文献:
[1] 薛毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2006.
[2] 何添锦.国内外城市竞争力研究综述[J].经济问题探索,2005,(5):21-24.
[3] 李文军.山东省地级市经济发展水平评价[J].临沂师范学院学报,2003,(6):77-80.
[4] 蔺兆荣.武汉城市圈城市竞争力比较研究[J].价值工程,2018,(33):62-63.
Applications of Cluster Analysis in Socio-economic Development of Cities in Guangxi
LIU Jian, ZHAO Yi
(Mathematics and Computer Dept., Guilin Normal College, Guangxi 541002, China)
Abstract: Due to the influence of many factors such as economic base, natural resources and geographical conditions, the economic development level of different cities in Guangxi is quite different. A correct understanding of these differences, so as to formulate appropriate policies to coordinate regional development and form regional joint forces, is of great significance to maintain sustainable, balanced and coordinated economic growth in the region. Therefore, according to the main socio-economic indicators and their data of Guangxi Cities in 2017 released by Guangxi Bureau of Statistics, four categories of 16 indicators are selected to measure the level of urban socio-economic development, and the development level of 14 cities in Guangxi is analyzed by cluster analysis, so as to study the classification of cities in Guangxi and the similarities and differences in the development level, According to the development level of Guangxi city classification, so as to understand the differences, provide reference for the future economic layout.
Key words: Guangxi; cities; economic development level; cluster analysis; urban competitiveness
关键词:广西;各城市;经济发展水平;聚类分析;城市竞争力
中图分类号:F127 文献标志码:A 文章编号:1673-291X(2021)14-0041-05
引言
聚类分析[1]是多元统计分析的一种,其核心思想是将每个样品看成p维空间的一个点,n个样品组成p维空间的n个点。通过定义各点之间的距离来衡量各样品之间的相似程度。距离近的点归为一类,距离远的点属于不同的类。聚类分析可以分为Q型聚类(样本聚类)和R型聚类(指标聚类)两种。聚类过程中常用的距离有欧氏距离、绝对值(cityblock)距离、马氏(Mahalanobis)距离等,常用的聚类方法有系统聚类法、动态聚类法和模糊K均值聚类法等。聚类分析能找到具有相似性的同类样品,也能够发现具有相异性的不同类样品。
近年来,城市竞争力已成为国际性的热点问题。国内关于这个问题的研究主要有:何添锦[2]阐述了当今国内外城市竞争力的研究现状,并对国内城市竞争力研究现状进行了评析,指出尚待深入研究的内容。李文军[3]运用主成分分析方法和聚类分析方法,对山东省17个地级市的经济发展情况做出综合评价,分析了各市在山东省中的经济地位。蔺兆荣[4]以2016年数据为依据,运用主成分分析法对武汉城市圈各城市竞争力进行评价。
目前,广西经济正在迅速发展,人民生活水平不断提高,但是由于经济基础、自然资源、地理条件等诸多因素的影响,广西不同城市的经济发展水平仍存在较大差异。正确的认识这些差异,从而制定合适的政策去协调区域发展,形成区域合力,对保持全区经济可持续、平衡协调的增长具有重要意义。根据广西统计局发布的2018年广西统计年鉴中的广西各市社会经济主要指标(2017年),对广西14个城市的社会经济发展状况进行聚类分析,可以按发展水平对广西各城市进行分类,从而认识差异,为未来的经济布局提供参考。
一、数据处理方法及过程
(一)指标的R型聚类
为全面分析广西各市的社会经济状况,对广西统计年鉴中的数据进行了简单的选取和加工,得到了2017年广西14个城市的4大类共33个指标。
由于选取的指标较多,指标之间可能存在较强相关性,导致其影响被放大。因此,先对33个指标按照其相关性进行R型聚类,再从每个类中选取具有代表性的指标。其步骤如下:
(1)计算各指标间的相关系数rij;
(2)定义各指标间的距离为dij=1-│rij│;
(3)按类平均法对指标进行聚类。
得到聚类图如图1。
依据距离情况考虑将指标分为16类,分类情况为:
1)农村居民人均可支配收入、农村居民人均生活费支出、城镇居民人均可支配收入;
2)每万人卫生机构床位数、每万人卫生机构人员数、每万人民用汽车拥有量;
3)地区生产总值、固定资产投资、公共财政预算收入、公共财政预算支出、互联网用户数在总人口中占比、社会消费品零售总额;
4)第一产业在地区生产总值中占比、工业总产值;
5)每万人工业企业单位、人均地区生产总值、城镇居民人均生活消费性支出;
6)常用耕地面积、农副产品总产量;
7)普通中小学平均学生数、每万人普通中小学学校数、普通中小学平均教师数;
8)第二产业在地区生产总值中占比、第三产业在地区生产总值中占比;
9)普通高等学校平均专任教师数、普通高等学校平均在校学生数。
以上9类指标因为具有较强相关性被聚为一类,其余未列出的指标单独作为一类。根据聚类的结果,结合全面性、客观性、实用性、独立性这四个原则,最后选择了4大类16个指标,如表2。
(二)样本的Q型聚类
由于各指标的量纲、量级、均值等方面存在较大差异,所以需要先对数据进行标准化处理,方法是将各指标的观察值减去该指标的平均数,然后除以该指标的标准差。其公式如下:
经标准化的数据都是没有单位的纯数量,取值范围在[-1,1]之间,且满足均值为0,标准差为1。
接下来,利用标准化处理后的指标对广西各城市进行聚类分析,取欧式距离,按类平均法聚类,得到聚类图如图2。
若将广西14个城市分为3类,得到的第一类城市为南宁市、柳州市和桂林市,第二类为北海市和防城港市,第三类为梧州市、钦州市、贵港市、玉林市、百色市、贺州市、河池市、来宾市、崇左市。
若分为4类,则第一类为南宁市,第二类为柳州市和桂林市,第三类为北海市和防城港市,第四类为梧州市、钦州市、贵港市、玉林市、百色市、贺州市、河池市、来宾市、崇左市。
若分为5类,则第一类为南宁市,第二类为柳州市和桂林市,第三类为北海市和防城港市,第四类为贵港市和玉林市,第五类为梧州市、钦州市、百色市、贺州市、河池市、来宾市、崇左市。
如果按城市规模、经济规模、公共事业发展水平、居民生活水平四大类指标分别进行聚类分析,可将各个城市分为5类,得到聚类图如图3,分类方法如表3。 二、结果的分析与讨论
从广西各城市按筛选出的全部16个指标的聚类结果来看,南宁市除了分3类时与桂林市和柳州市聚在一类,另外2次聚类均单独作为一类,说明南宁市在社会经济发展水平上与各城市存在较大差距。在所选的16个指标中,南宁市有7个指标全自治区最高,其中“户籍人口数”、“地区生产总值”、“每万人普通高等学校数”、“每万人民用汽车数”分别是全区平均值的1.9倍、2.8倍、3.4倍、2倍,可见,南宁作为省会城市,在社会经济发展水平上大幅度领先于区内其他城市。
桂林市和柳州市在按全部指標聚类时始终归为一类,表明两市的社会经济发展水平比较接近。从指标值来看,两市的绝大部分指标都达到或超过全区平均值,发展水平与南宁市较为接近,领先于广西其他城市。但是两市的优势并不相同,柳州市的“工业总产值”和“人均生活消费性支出”两个指标全区最高,其中“工业总产值”是全区平均值的2.7倍。桂林市的“每万人卫生机构数”这一指标全区第一,是平均值的1.6倍。两座城市的弱势相同,“进出口总额”都比较少,桂林市只有全区平均值的四分之一,柳州市作为一座工业城市,“进出口总额”仅为全区平均值的三分之二,说明两市在对外贸易上的开放都还不足。两市“每万人普通中小学学校数”也都比较少,只到全区平均值的一半,与其社会经济发展水平不匹配,可能导致两市居民在中小学教育上出现一定程度的入学难问题。
北海市和防城港市始终被聚为一类,从指标来看,主要是两者同为海港城市,城市规模都比较小。在城市规模的4个指标中,北海市“行政区域土地面积”全区倒数第一,防城港市倒数第二,分别是全区平均值的24%和36%;防城港市的“户籍年末总人口”和“常用耕地面积”全区倒数第一,北海市倒数第二,都远低于全区平均水平。两市的经济规模相近,北海市工业产值较高,防城港市则在进出口方面高于全区平均水平,两市居民生活水平的各指标都略高于区平均水平。
广西其他城市的社会经济发展水平大致相当,细分为5类时,玉林市和贵港市两市被聚为一类,两市地理位置接近,社会经济发展水平也比较接近,都具有人口较多、公路网发达的优势,但是高教水平发展都比较低。截至2018年,玉林市作为一个有700万户籍人口的城市,仅有一所高校;贵港市有500多万户籍人口,一所高校都没有。
从按4大类指标分别聚类的结果来看,南宁市社会经济发展水平较高,柳州市和桂林市相对比较均衡,而其他各城市则都存在一定程度的问题,广西各城市的社会经济发展状况呈现出一极两强众弱的金字塔结构。南宁市目前仍然没有辐射出具有较高发展水平的城市圈,区内发展较好的柳州市和桂林市在地理位置上与南宁市间隔较远,联系不够密切,自身的向外辐射效应也不明显。所以,广西要想在经济上取得更进一步的发展,还是要立足于以现有的发展水平较高的强市为中心,积极探索建设城市间相互联动的经济区和经济带,形成以点带面的效应,增加具有一定社会经济发展水平的区内二线城市的数量,这是在未来经济布局中需要考虑的发展方向。
参考文献:
[1] 薛毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2006.
[2] 何添锦.国内外城市竞争力研究综述[J].经济问题探索,2005,(5):21-24.
[3] 李文军.山东省地级市经济发展水平评价[J].临沂师范学院学报,2003,(6):77-80.
[4] 蔺兆荣.武汉城市圈城市竞争力比较研究[J].价值工程,2018,(33):62-63.
Applications of Cluster Analysis in Socio-economic Development of Cities in Guangxi
LIU Jian, ZHAO Yi
(Mathematics and Computer Dept., Guilin Normal College, Guangxi 541002, China)
Abstract: Due to the influence of many factors such as economic base, natural resources and geographical conditions, the economic development level of different cities in Guangxi is quite different. A correct understanding of these differences, so as to formulate appropriate policies to coordinate regional development and form regional joint forces, is of great significance to maintain sustainable, balanced and coordinated economic growth in the region. Therefore, according to the main socio-economic indicators and their data of Guangxi Cities in 2017 released by Guangxi Bureau of Statistics, four categories of 16 indicators are selected to measure the level of urban socio-economic development, and the development level of 14 cities in Guangxi is analyzed by cluster analysis, so as to study the classification of cities in Guangxi and the similarities and differences in the development level, According to the development level of Guangxi city classification, so as to understand the differences, provide reference for the future economic layout.
Key words: Guangxi; cities; economic development level; cluster analysis; urban competitiveness