探索性数据分析在能源消费中的应用探讨

来源 :现代商贸工业 | 被引量 : 0次 | 上传用户:qq1123388099
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  (中南财经政法大学统计与数学学院,湖北 武汉 430073)
  摘 要:根据英国《金融时报》报道和英国石油公司(BP)的《世界能源统计年鉴》显示,2010年,中国已超过美国成为世界上最大的能源消费国,而全球能源消费增速也达到1973年以来的最高水平。因此,对能源消耗的问题研究有重要的意义。从能源消费影响因素看,一国能源消费与该国人口数量、GDP和所处纬度均呈显著正相关,鉴于人口和能源消费关系的研究颇多,主要对人均生活能源消费和人均GDP的关系进行研究。对两者关系采用了普遍的最小二乘法和探索性数据分析中的三组耐抗线方法进行对比得出相关关系。
  关键词:人均生活能源消费;AGDP;OLS;三组耐抗线
  中图分类号:C93 文献标识码:A文章编号:1672-3198(2011)17-0046-02
  1 问题提出
  能源是人类赖以生存和发展的重要物质基础。在某种意义上讲,人类社会的发展离不开优质能源的出现和先进能源技术的使用。在当今世界,能源的发展,能源和环境,是全世界、全人类共同关心的问题,也是中国社会经济发展的重要问题。但是,人类在享受能源带来的经济发展、科技进步等利益的同时,也遇到一系列无法避免的能源安全挑战,能源短缺、资源争夺以及过度使用能源造成的环境污染尤其是能源利用等问题威胁着人类的生存与发展。
  能源消费总量是指一定时期内,全国各行业和居民生活消费的各种能源的总和。该指标是观察能源消费水平、构成和增长速度的总量指标。能源消费总量包括原煤和原油及其制品、天然气、电力,不包括低热值燃料、生物质能和太阳能等的利用。能源消费总量分为终端能源消费量、能源加工转换损失量和能源损失量三部分。
  人均生活能源消费量是根据煤炭、电力、煤油、液化石油气、天然气、煤气这几种生活能源的消费总和换算成千克标准煤后的结果。它是反应每人对生活能源的消耗。
  国内生产总值(Gross Domestic Product,简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。一般来说,国内生产总值共有四个不同的组成部分,其中包括消费、私人投资、政府支出和净出口额。用公式表示为:GDPCA+I+CB+X 式中:CA为消费、I为私人投资、 CB为政府支出、X为净出口额。
  人均国内生产总值(Real GDP per capita),也称作“人均GDP",常作为 发展经济学中衡量经济发展状况的指标,是重要的宏观经济指标之一,它是人们了解和把握一个国家或地区的宏观经济运行状况的有效工具。将一个国家核算期内(通常是一年)实现的国内生产总值与这个国家的常住人口(目前使用户籍人口)相比进行计算,得到人均国内生产总值。是衡量各国人民生活水平的一个标准,为了更加客观的衡量,经常与购买力平价结合。
  随着经济快速增长,中国能源供给和需求呈现较快增长态势。从能源消费水平看,虽然能源消费总量较大,但人均能源消费量较低,基于购买力平价的单位GDP能源消耗并不高,单位能源消耗GDP产出的增速较快。从能源消费结构看,与世界主要国家和地区相比,中国工业能源消费占比偏高,而交通能源消费占比偏低,近年来生活能源消费占比明显提高。从能源消费影响因素看,一国能源消费与该国人口数量、GDP和所处纬度均呈显著正相关,本文主要对人均生活能源消费和人均GDP的关系进行研究。
  2 数据来源及简单分析
  相关数据来源于统计局发行的《2009年国家统计年鉴》,针对能源和GDP增长的研究,笔者从中选取了1990-2007年的人均GDP和平均每人生活消费能源的量。笔者发现,随着人均GDP的不断增长,平均每人生活消费能源在大体上也呈现增长的趋势。首先对两组数据进行简单的图形和线性分析。
  通过简单绘制由图1我们可以发现平均每人生活消费能源关于人均国内生产总值的散点图,我们可以通过散点图观察发现两者间存在着某种线性关系,则猜测平均每人生活消费能源与人均GDP有着密切联系,还有待下文的进一步研究与探讨。通过绘制平均每人生活消费能源和人均国内生产总值这两个箱线图对比我们可知,人均GDP分别比较均匀,没有明显的左右偏态,而平均每人生活能源数据左偏,并且有两个明显的离群值。两个离群值分别为2006年和2007年这两年的平均每人生活能源数据,笔者认为,应该是由于科学技术不断地进步而导致的人们生活水平和质量提高而导致的。最后我们通过对平均每人生活消费能源与人均国内生产总值的简单线性分析可知,平均每人生活消费能源与人均GDP间的相关系数为0.828,P值0.000符合假设检验的条件,有着比较良好好的拟合。但因为我们无法很正确的判断两者的数据分布情况,突出严谨性,所以我们尝试数据变换。
  3 数据变换
  数据变换可保持其批中数据的次序,保持一个批的字母值,不计由于数据点之间作内插造成的小差异,保证原始批中非常靠近的点,在重新表达后批中也非常靠近,至少相对于新尺度很靠近,保证函数没有尖锐的拐角,并且由初等函数来规定,以便差不多用最简单的手持计算器就可以快而方便地做重新表达。
  下面是对人均GDP进行图形变换,采用了以十为底和以自然数e为底的对数变换和平方根和四次方根变换。
  表1
  注:模型1为以十为底的对数变换,模型2为以自然数e为底的对数变换模型3为平方根变换,模型4为四次方根变换。
  由对比分析可知,以十为底、以自然数e为底的对数变换和平方根、四次方根变换后的相关系数并没有增大反而减少了,均小于原来没有变换前的相关系数0.828。从而笔者采取原来没有变换过的数据进行统计回归分析。
  4 最小二乘法(OLS)与三组耐抗线比较
  4.1 最小二乘法
  根据相关数据采用相关统计软件进行最小二乘回归分析,我们可以得到,最小二乘法最后所得的模型为:
  y112.381+0.004x(其中,y为平均每人生活消费能源,x为人均GDP)
  4.2 三组耐抗线
  探索性数据分析中,我们广泛的用残差图提示对于拟合的改进,察看这技术如何对数据起作用给出拟合,以及描写这拟合的适当性。探索性方法,以对于误差较弱的要求,用稳健耐抗性方法。耐抗性技术被用来揭露和放大数据中的模式。这些模式不是选择模型时事先预料到的,而是部分的取决于所用的分析技术。
  首先将18年的数据按照人均GDP从小到大排列,我们可以发现表1的自变量人均GDP已是从小到大排列。由于18可以被3整除,并且x值没有等值结,三个组的每个包含6个数据点。则三个组内的总括点是:
  4.3 残差分析
  拟合,一般不能完全的描述数据。我们可以用残差逐步地改进拟合,通过用重新表达,用新增变量,以及用特别处理异常数据点。通过上两部分的计算说明,笔者发现最小二乘法拟合的线性关系y112.381+0.004x与三组耐抗线拟合的线性关系y141.776+3.7857×10-3x并没有明显的区别,只是在截距上有些许区别。所以我们可以通过绘制最小二乘法和三组耐抗线的残差图进一步比较两个方法针对本论题的优劣性。
  如图1,对比最小二乘法和三组耐抗线的残差,笔者发现,虽然两个残差图很相似,但是三组耐抗线的残差的布局往下些,这说明,如果从中移掉四个负斜率的直线后,最小二乘法德残差看起来会更水平些。
  5 进一步研究
  然而,我们不难发现新的拟合过程的残差呈线性关系,可能是数据的误差和前几年收集统计数据的方法不够完善,相互的关系还有待进一步的研究和探讨。
  表2
  参考文献
  [1]Wendy L.Martinez,Angel R.Martinez,《Exploratory Data Analysis with Matlab》,2005 by Chapman & Hall/CRC Press.
  [2]陈忠琏,郭德媛译,杨振海校,探索型数据分析[M].北京:中国统计出版社出版.
  [3]吴国培,吴伟.中国能源消费现状及影响因素[J].中国金融,2011,(8).
其他文献
摘 要:对罗尔斯的《政治哲学史讲义》英文版的研读,以及对马克思相关著作的阅读获得了一些感悟,对罗尔斯关于马克思理想社会的主要特征有了更深入的认识。将站在罗尔斯的立场上对马克思理想社会的三个特征进行尝试性的阐释和梳理。马克思的理想社会就是一个自由联合的生产者的社会,它的特征主要有:意识形态的消失、没有剥削、没有异化。  关键词:马克思;理想社会;意识形态;剥削;异化  中图分类号:A8文献标识码:A
期刊
摘 要:定制酒是一種高端的酒类消费品,具有多样化、个性化、生命周期短等特征。为了满足顾客需求,企业的研发流程必须快速、高效的响应。从流程管理角度出发,以LZ公司定制酒产品开发为例,通过构建产品设计结构矩阵,运用模糊聚类算法对产品研发流程进行分析,提出新的面向顾客协同产品开发流程对其优化,实现产品研发工期,工艺及质量的改进。  关键词:定制酒;顾客协同;DSM;流程优化
期刊
摘 要:随着上市公司的越來越多,上市公司的经营状况也存在越来越多的问题,及时发现上市公司存在的经营风险和财务风险,对其各利益相关者来说都十分必要。主要通过Altman的Z计分模型和中国股票应用软件中常用的Z值计算法分别对安徽省的62家上市公司的财务风险进行了预测,结果发现中国股票应用软件中常用的Z值计算法得到的存在的财务风险的公司明显少于Altman的Z计分模型得到的公司,并且通过比较发现运用中国
期刊
摘 要:安徽省自古就是一个农业大省,农业在全省占据了举足轻重的地位,安徽省农民职业教育的研究对安徽省经济甚至各方面的发展都具有十分重大的意义。通过实地调查研究的370份问卷结果,旨在对安徽省农民职业教育的发展现状做出初步描述,指出安徽省在这方面存在的问题;最后,针对这些问题,提出一些对策建议。  关键词:农民职业教育;供给现状;存在的问题;对策建议  中图分类号:G4文献标识码:A文章编号:167
期刊
摘 要:独立董事制度对于完善中国上市公司治理结构具有重要作用,然而国内外却鲜有关注独立董事社会资本与公司绩效的相关性报道。因此随机选取2008-2011年的411家上市公司为样本,实证检验独立董事社会资本对公司绩效的影响。研究发现:从业年龄、纵向关系网络规模与公司绩效的相关性与假设一致,具有显著的相关性;而独立董事的横向关系网络规模以及声誉对公司绩效没有显著影响。  关键词:独立董事;社会资本;绩
期刊
摘 要:董事会作为公司治理内部核心机制之一,在公司治理当中一直是一个重要的决策和监督机构。董事会是否对公司债务成本存在影响,国内学者研究的比较少。首先详细分析了关于董事会特征和债务成本关系的理论观点,然后以广东省A股上市公司为研究样本,以2008年为数据窗口,实证分析了董事会四个特征:董事会规模、独立董事比例、董事持股比例、董事长与总经理两职合一与公司债务成本之间的关系。研究结果表明:董事会规模与
期刊
摘 要:美国《萨班斯——奥克斯法案》要求强制轮换会计师事务所,我国也有签字注册會计师定期轮换的制度。这些法规政策的存在说明审计任期与审计质量之间必然存在着一定的联系。独立审计的最终目的是为了提高会计信息的质量。而会计稳健性是会计核算的重要原则,我国会计准则将会计稳健性作为会计信息质量要求的一个重要部分。通常,人们认为随着审计任期的延长,审计师与客户存在着诸多足以影响审计质量的利益关系。为此,试图从
期刊
(中铁二局,四川 成都 610031)  摘 要:中铁二局作为国内最早上市的大型国有铁路建设企业,近年来,在国家基建项目大幅提高的情况下,企业的生产经营规模不断提升。随着企业的市场竞争能力和社会影响力的不断扩大,人才队伍的建设问题也日益凸显。试从人才队伍的多层次建设方面探讨在这种新形势下如何满足企业人才的多样需求。  关键词:新形势;多层次;人才队伍建设  中图分类号:F24 文献标识码:A文章编
期刊
摘 要:通过问卷调查数据对海南省普通高校武术课教学现状进行了分析,指出了目前武术课教学中存在的问题,并在此基础上提出了相应的对策建议。  关键词:武术;教学现状;对策  中图分类号:G4文献标识码:A文章编号:1672-3198(2012)01-0215-02  1 问题的提出  20世纪90年代以来,作为公共课教学改革的重要组成部分的高校体育教学也经过近10年的教学改革,无论在课程设置或是教学方
期刊
摘 要:探讨在信息技术和网络多媒体环境下用语料库和数据驱动学习教学方法指导开发高中英语词汇教学资源,提升词汇高中学生词汇学习效能的可能性和实施策略。  关键词:信息技术;教学方法;英语  中图分类号:G4文献标识码:A文章编号:1672-3198(2012)01-0212-01  1 信息技术运用于高中英语教学的理论基础  根据建构主义学习理论,在运用多媒体和网络技术进行初中英语教学时,应充分发挥
期刊