论文部分内容阅读
改革开放以来,随着中国的经济高速发展,各个行业都已经有了飞跃的进步。科技在现在的经济发展中起着越来越重要的作用。目前,人民已经在总体上达到了小康水平,我国也已经成为了世界上最有潜力的大国。中国的经济离不开改革开发,离不开科技的发展,离不开各行各业努力工作的人民的辛勤努力。从十九世纪五十年代以来,中国已经陆续地完成了是一个“五年计划”,在这五十多年里,中国所取得的成就是全世界有目共睹的,中国的经济得到了非常快的增长,为国民经济的发展打下了非常坚实的基础。本文的研究对象是《中国统计年鉴-2012》中的行业统计数据,数据包含有年份的行业统计数据和地区的行业统计数据。本文建立的主要模型是主成分-聚类模型。该模型的主要思想是将数据先进行主成分分析,达到降维的目的;然后将降维后的数据进行聚类分析,从而得到聚类分析结果。本文要建立的主成分聚类模型有两个,一个是对16年(1996年至2011年)的数据进行聚类,即按照年份行业统计数据,把16年分成几个时间段。第二个模型是对31个行政地区进行聚类分析,根据地区行业统计数据,把31个地区分类。对年份行业统计数据建立主成分聚类分析模型的步骤如下:(1)将《中国统计年鉴-2012》中的行业统计数据进行统一化处理,即:归一标准化处理。(2)数据预处理后,得到的数据为16个对象,每个对象有22个行业属性,将数据进行主成分分析。(3)将降维后的数据进行聚类分析,得到聚类结果。对地区行业统计数据建立主成分分析模型的具体的步骤如下:(1)将《中国统计年鉴-2012》中的行业统计数据进行统一化处理,即:归一标准化处理。(2)数据预处理后,得到的数据为31个对象,每个对象有20个行业属性,将数据进行主成分分析。(3)将降维后的数据进行聚类分析,得到聚类结果。通过这两个模型,对行业统计数据进行年份的划分和对地区的划分,能更好的了解中国的经济信息。