论文部分内容阅读
改革开放以后,我国的科学技术方面的发展逐步增强,科技体制改革不断的深化,国家的创新体制也在不断的稳步向前走,遵循了我国经济发展的规律,也遵循了科技自身发展的规律。目前的科技发展的格局满足了市场的需求,并且以市场的需求为导向,正在慢慢地发展。我国的科技资源的配置正在进一步优化的过程之中,市场资源的配置也是在市场规律的导向作用下自发完成的,很多国家级的资源项目,均是通过竞争来实现的,市场是竞争的结果,优胜劣汰,这就是市场本身。通过研究中国统计年鉴中的科学技术相关的数据,得到全国31个行政单位的统计数据,包括专利申请数、新开发项目数、有产品或工艺创新活动的企业数、测绘基准成果等51个统计变量。本文针对31个行政单位的统计数据进行分地区科学技术数据分析,主要完成以下两个工作。(1)对分地区科学技术数据进行主成分分析。经过对《中国统计年鉴》中分地区科学技术相关的统计数据进行分析,得到31个行政单位51个属性变量的统计数据,维数较高,对数据进行主成分分析。主成分分析就是将多个属性变量转化为少数几个主成分的过程。在主成分分析的过程中,达到两个目的,第一个目的是降维,简化数据结构,第二个目的是少数几个主成分组成的数据矩阵还能够反映大部分的数据信息。主成分分析,可以说是将原始数据属性变量进行浓缩的一个过程。经过主成分分析,将51个属性变量降维,用8个主成分来表示。通过计算主成分得分,得到31个行政单位的科学技术相关的综合得分,对31个行政单位进行排名,并且给出参考意见。(2)对分地区科学技术数据聚类分析。聚类分析是数据挖掘中的一项重要的知识手段。它主要是利用“物以类聚”的思想将数据信息进行分类,将特征相似或者相近的对象放在同一个类中,将特征不同的对象放在不同的类中。将31个行政单位的统计数据得到的主成分结果进行K均值聚类分析,得到3个聚类结果,依次定义为“科学技术发达地区”、“科学技术一般地区”和“科学技术不发达地区”,为我国的经济做出相关的参考性数据分析。