基于Benford法则的GDP数据可靠性分析

来源 :中小企业管理与科技·下旬刊 | 被引量 : 0次 | 上传用户:planet0371
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文利用Benford定律并结合统计检验的方法,以四川省GDP相关数据为例,对我国地区统计数据质量的可靠性进行了研究。
  关键词:Benford法则 GDP数据 可靠性
  1 统计数据质量及可靠性的界定
  质量是一个哲学概念,它是一个多维的立体的概念,具有相对性。随着人们质量观念的变化,人们逐步认识到质量不仅包括产品的使用性能,还包括需求客户对产品的满足程度,它成了一个内涵丰富的综合性概念。不同社会组织机构、不同用户、不同时期会有不同的质量标准和要求。同样,统计数据作为统计工作的产品,对统计数据质量内涵的认识也逐渐发生了变化。
  过去认为统计数据质量就是统计数据的准确性,即统计数值与目标特征真实数值的接近程度或一致程度。而现在对统计数据质量的理解则由过去的单标准变成多标准、多层次的综合概念,具体要求的标准更多了,比如要求准确、适用、及时、可比、可取和客观等多具体标准。
  可靠性是一个数理概念,是质量范畴的小概念,主要用来刻画统计数据质量标准之一的统计数据准确性的标尺,也就是对实际数据与真值之间的误差进行评估。评估数据质量可靠性的方法有很多,如经验分布检验、统计指标之间的逻辑检验、相对指标的相关分析、计量模型评价等。
  2 Benford定律
  我们知道,在社会经济统计领域很多统计总体的个体标志值在理论上服从某一特定的统计分布。鉴于此,通过对统计总体中的各个个体标志值进行特定的统计分布检验,可以初步判断出各个个体的标志值是否正常、可信。为此,笔者选择了Benford定律对四川省GDP相关数据进行可靠性检验。
  Benford定律是自然数字的一种内在规律,其含义是指假设在样本空间足够大的情况下,第一位数字为1到9之间的数字发生的概率具有一定规律,越小的数字出现的比率越高,其中1为第一位数字出现的概率达0.3,2为第一位数字出现的概率为0.17-0.19,以此类推,8或9为第一数字出现的概念仅有0.05左右。
  该定律的主要奠基人Frank Benford对人口出生率、死亡率、物理和化学常数、素数数字等各种现象进行统计分析后发现,由度量单位制获得的数据都符合Benford定律,即自然数1到9的使用频率,公式为:
  F(d)=log[1+[1/d]] d=1,2,3……,9
  应该指出的是,利用Benford定律必须保证研究的数据无序且未人为修饰。该定律不但适用于第一位数字,也可用于第二位、第三位数字。在采用Benford定律,由公式计算得到的各位数字的标准分布概率,如表1结果所示:
  表1 Benford定律的各位数字的标准分布概率表
  ■
  此外,Benford定律也遵从大数法则和中心极限定理,基于文章篇幅的原因,这里就不一一证明。
  3 基于Benford定律的四川省GDP统计数据实证分析
  考虑到Benford定律在应用时候遵从的条件,如果我们所研究的数据样本存在人为加工处理,则该数据样本不符合该定律。所以对数据样本进行质量评估过程中,利用Benford定律进行分析,来检验数据的真实与否,是可信的。国内研究对Benford定律的应用主要集中在财务审计对上市公司的研究领域,很少有利用其对地区统计数据质量做实证研究分析。为此,本文选取了四川省1978-2011年的地区生产总值相关数据进行检验,判断四川统计数据质量是否可靠。
  3.1 建立假设
  假设四川省地区生产总值是可信的,根据Benford定律,GDP数据的前两位数的数字分布情况应该与Benford定律下的数字分布情况相同。为此,我们建立两个假设:
  针对?字2检验,从整体出发,提出如下两个假设:
  H1:四川省GDP数据的第一位数的出现次数与Benford定律下的随机分布相一致;
  H2:四川省GDP数据的第二位数的出现次数与Benford定律下的随机分布相一致。
  针对Z检验,从具体每个数字出现频率的期望值出发,提出如下两个假设:
  H3:四川省GDP数据的第一位数中每个自然数(1,2,
  3,……,9)出现频率与Benford法则下的频率相一致;
  H4:四川省GDP数据的第二位数中每个自然数(0,1,
  2,3,……,9)出现频率与Benford法则下的频率相一致。
  3.2 数据说明
  为了研究的深入,本文在考虑四川省GDP相关数据基础上,将四川省地区生产总值数据细分为第一、二、三产业三部分,并把同时期的人均地区生产总值数据纳入。数据均为历年四川省统计年鉴整理,具体数据略。
  所采用的研究方法是用Excel软件分别统计1978年-
  2011年四川省地区生产总值相关数据第一位数1至9这九个自然数和第二位数0至9这十个自然数出现的次数,并进行?字2检验和Z统计检验。
  3.3 检验统计量
  通过?字2拟合优度来评估出现的每个自然数出现的观测值和期望值之间的概率分布的拟合程度,以此来佐证四川省地区生产总值样本数据大小和总体上存在偏差;采用Z统计来评估各个自然数出现次数的差异性。两个检验公式如下所示:
  ?字2=∑[(ai-Ei)2/Ei]
  式中ai是出现在观测值第一或第二位数的数字i的实际频数,Ei是出现在期望值中第一或第二位数的数字i的理论频数。
  Zi=(P■-P■)/■
  其中,P■为出现在观测值第一或第二位数的数字i的实际频率,P■为出现在期望值中第一或第二位数的数字i的理论频率,n为采集分析所用样本量。
  当?字2越大,则表明研究数据总体上出现自然数的概率越小,更说明是人为修饰过的数据,则准确性很差;当Z绝对值越大的时候,该数字出现的频率与期望的频率偏离得越远。   3.4 检验主要结果
  3.4.1 首先我们把1978年-2011年四川省GDP相关数据合并在一起,第一位数字分布偏差情况如下表2所示:
  表2 四川省GDP相关数据首位数字分布的?字2拟合优度检验表
  ■
  在0.05的显著性水平下,通过查表,我们可以得到 ?字2分布(df=8)的临界值为15.507。由上表2可知,首位数字分布的?字2统计值为1.9641,小于15.507,我们不能拒绝假设H1;同时,出现自然数Z统计量绝对值均小于1.96(0.05显著性水平下的Z值),我们应该接受假设H3。因此,在显著性水平(0.05)情况下,四川省GDP相关数据首位数字出现情况与期望频率没有明显不同。
  由上面的检验结果,我们可以看出四川省GDP相关数据的第一位数字分布规律与Benford定律下的期望情况是一致的。所以,继续对四川省GDP相关数据的居第二位出现的自然数的分布采用相关理论进行检验。
  3.4.2 四川省GDP相关数据第二位数字分布的?字2拟合优度检验如下表3所示:
  表3 四川省地区生产总值相关数据第二位
  数字分布的?字2拟合优度检验表
  ■
  在0.05的显著性水平下,通过查表,我们可以得到?字2 分布(df=9)的临界值为18.314。由表2可知,居第二位数字出现的频率服从分布的?字2统计值为3.5666,小于18.314,我们不能拒绝假设H2;从中我们还应该看出数字9的Z统计量绝对值大于1.96(0.05显著性水平下的Z值),我们应该接收假设H4。因此,在显著性水平(0.05)情况下,不能认为四川省GDP相关数据第二位数字的出现自然数频率与期望频率无差异性。
  根据这一检验结果笔者认为,四川省GDP相关数据的第二位数字的分布规律与Benford定律下的期望规律不符合。
  4 主要结论
  本文通过Benford定律的应用并结合了统计检验的方法,对四川省GDP相关数据进行了可靠性分析。研究结果显示,四川省地区生产总值相关数据在首位数字分布上符合本福特法则,但在第二位数字分布上并不完全符合本福特法则,说明统计数据并不十分可靠。究其原因,可能有三:
  其一,我们所研究的该样本数据被人工修改过;
  其二,研究条件中样本量还不够大,研究的选择样本空间人为在选择时候就出现了选择性偏差,其结果就出现了统计误差;
  其三,Benford定律的检验建立在数据真实的基础上,且需要受检验的数据满足具有稳定增长率的条件,这本身就是一个缺陷。
  参考文献:
  [1]傅德印,陶然.对政府统计数据质量成本的探讨[J].统计研究,2007(8).
  [2]东方杜奇.新时期统计数据质量可靠性研究[J].特区经济,2005(4).
  [3]斐辉儒,宋伟.我国统计数据质量体系存在的问题及解决思路[J].统计与决策,2006(4).
  作者简介:晏正春(1979-),湖南沅江人,成都信息工程学院统计学院教师,讲师,硕士研究生。
其他文献
摘要:2014年9月习近平主席在北师大,与广大师生共庆第三十个教师节之际,倡导全国教师争做党和人民满意的好老师。本文试从高职院校基础课教师的教学对学生的终身发展具有重要奠基作用,高校教师应具有高尚的职业道德,不断提升教书育人的能力,发挥人格魅力的积极影响等几方面来阐释如何提升高职院校基础课教师的职业能力,努力做一名有理想信念、有道德情操、有扎实学识、有仁爱之心的“四有”好老师。  关键词:好老师
期刊
摘要:当前高技能人才培养中存在的主要问题有:院校培养的高技能人才技能水平不高;高技能人才培養重理论轻实操,课程设计以理论为主;高技能人才供不应求,缺口较大;盲目招生现象突出。而大学生轻实践重理论的现状也导致大学生就业方面出现种种问题。因此,本文首次将高职院校中的高技能人才培养引入到高校培养中来,结合高校学科学习与高技能人才现状,合理地提出高校高技能的人才培养的对策。  关键词:大学生就业 高技能人
期刊
摘要:实训基地是实现高职院校“工学结合”人才培养目标的关键所在,是实行工学交替、顶岗实习的物质基础。本文就高职院校会计专业建立实训基地的必要性和可行性进行了剖析,并结合河北工程技术学院会计专业现状从学校、企业、校企合作三个层面提出了建设会计专业实训基地的措施,旨在加快会计专业实训基地的建设。  关键词:会计专业 校企合作 实训基地  高职院校不同于普通高等教育,更强调学生的实践技能,这就决定了高职
期刊
摘要:随着高职教育信息化进程的快速推进,依托“职教新干线”平台的空间教学以一种全新的教学、学习方式应运而生。本文以郴州职业技术学院“职教新干线”网络空间教学为例,阐述了以网络空间“引导自主学习”为主、教师传统面授教学为辅的“PRO/E”课程教学新模式,讨论了网络空间教学的优势与尚待思考的问题,最后评价在该种模式下所取得的教学效果。  关键词:空间教学 自主学习 职教新干线  0 引言  随着高职教
期刊
摘要:本文主要介绍寄生营销的基本理论知识,并结合寄生营销理论知识分析企业经营案例——浙江泉泓印刷器材有限公司与杭州KL机电工业有限公司在胶印版材制造业中的寄生关系与寄生营销的运用。内容包括寄生企业基本情况,寄生企业行业背景,寄主企业基本情况,寄生企业寄生营销成效,寄生企业产品的寄生方式和寄生企业采用寄生营销的原因。  关键词:寄生营销 营销 企业经营案例 实证研究  1 寄生营销的基本理论  寄生
期刊
摘要:小额信贷机构有效地为农村贫困人口提供小额贷款与其他金融产品,解决了农村金融的困境。商业银行在同业竞争激烈、原有业务饱和的基础上,支农小额信贷业务将成为其新的利润点。本文在对阐述小额信贷内涵及作用的基础上,对商业银行开展支农小额信贷业务的现状及问题进行分析,并从控制小额信贷风险、完善保障保险制度等几个方面,提出对策建议。  关键词:支农小额信贷 风险覆盖 法律保障  小额贷款主要是指面向中低收
期刊
摘要:老字号具有不可估量的历史文化价值和品牌价值。文章从苏州老字号企业自身及外部分析了制约其发展的因素,从企业和政府两方面提出促进苏州老字号企业发展的对策。企业自身要提升管理水平,加强创新和重视知识产权战略,政府要重点解决企业无形资产的产权问题并在经济、人才、宣传等方面对老字号予以支持。  关键词:老字号 制约因素 无形资产产权 对策  随着当前市场经济的不断发展,一些老字号企业也面临着前所未有的
期刊
摘要:本文简述了海南省推广惠农支付服务的调查与思考。  关键词:惠农支付服务 调查 思考  今年4月,国务院办公厅出台了《关于金融服务“三农”发展的若干意见》,《若干意见》“以发展农村普惠金融”为出发点和落脚点,对支付服务的要求涉及“非现金支付工具推广、支付系统建设、农村支付服务环境建设”等四项要求,人民银行海口中心支行自2011年来在助农取款服务点建设中取得的成绩,很大程度上与《若干意见》要求相
期刊
摘要:2014年,以P2P网络借贷、众筹等为新兴力量的互联网金融发展继续保持快速增长的态势。伴随着P2P借贷行业发展的同时,问题平台事件频频发生。为此,本文以杭州某P2P网络借贷公司风险案例为例,分析其主要风险点,并为P2P网络借贷行业的健康发展提出相应的建议。  关键词:P2P 风险管理 案例分析  P2P(Peer to Peer,个人对个人、点对点)网络借贷是指一种基于网络平台实现的个人与个
期刊
摘要:2013年7月1日起施行的《建设工程工程量清单计价规范》在深入分析当前建筑市场热点和难点问题基础上,着力解决了市场存在的突出问题和矛盾。第五章“招标控制价”部分,不但对“招标控制价”编制提出了明确要求,而且对“招标控制价”争议处理也做了详尽说明。严格执行、准确理解、正确使用是实践中编制“招标控制价”的关键。  关键词:工程量清单 招标控制价  2013年7月1日起施行的《建设工程工程量清单计
期刊