论文部分内容阅读
随着我国经济的快速发展,国民的经济水平也相应的得到了很大的提高,为保证国家和社会的和谐发展,国民的收入需要相应的得到基本的保证和合理的提高。工资水平是由企事业单位按照自身的经营或管理需求来确定的,国家规定了最低工资,一方面也是兼顾目前的实际经济形势,以保证企业的经营稳定性,另一方面也要顾及职工的基本生活需求,促使企业承担起自己的社会责任,努力提高企业的盈利水平,总体的思想是兼顾职工与企业的利益,达到双赢的目的。因此,一个地区的工资水平不仅是居民生活水平的体现,也反映了当地经济发展现状,具有较高的研究价值。本文数据来源是《辽宁省统计年鉴-2015》,辽宁省统计年鉴是一部资料性的年刊,信息高度密集,全面统计了辽宁省经济方面、科技方面、社会方面等的数据,从多个方面反映了辽宁省的发展情况。将辽宁省14个地级城市职工工资方面的数据进行统计,主要包括2011年至2014年在岗职工工资方面数据和2014年各个行业在岗平均工资,共计52个工资方面的指标。本文主要研究内容是辽宁省城市职工工资方面的分析。通过数据挖掘中的算法,对辽宁省城市在职工工资方面进行分析,主要完成了以下两个任务。第一,主成分得分在辽宁省城市职工工资方面排名中的应用。主成分分析是一种综合的统计方法,它将多个综合指标转化成少数主成分,将高维数据信息转化成低维的主成分信息,并且低维的少数几个主成分信息能够反映原始数据属性变量的绝大多数的数据信息。利用主成分分析,将统计数据中的52个工资方面指标进行降维,得到3个主成分,通过计算主成分得分,对辽宁省14个城市在职工工资方面进行综合排名,并且针对排名结果进行分析。第二,主成分聚类在辽宁省城市职工工资方面聚类中的应用。聚类分析是数据挖掘中比较重要的一种算法。K-means算法属于聚类分析中比较常用的一种算法,K-means算法是一种广泛的划分算法,它的优点是能够处理大量的数据集,能够对高维数据进行聚类,并且效果比较好。K均值聚类算法的特点是尽量将相同或者相似的对象聚集在一起,而不相同或者差异较大的对象则被分在不同的类中。主成分聚类算法就是将主成分分析算法和K均值聚类算法相结合,先进行主成分分析,然后进行聚类。将主成分分析得到的3个主成分结果进行整理,针对14个地级城市进行聚类,将14个地级城市在职工工资方面进行聚类,分成三类,并根据聚类结果进行分析,为辽宁省职工工资方面提供参考性信息。