论文部分内容阅读
6月24日,国家统计局局长马建堂致信联网直报企业负责人和统计人员:“统计执法检查发现,个别地方在联网直报中仍然存在干预企业真实独立上报现象,有的编造企业虚假数据、有的要求企业填报虚假数据、有的代填代报企业数据。”
此前,国家统计局也曾曝光包括广东省中山市横栏镇在内的多个地方的统计弄虚作假行为。实际上,统计数据存在的各种问题一直是中国的“隐痛”。
2009年,中国经济学家甘犁开始着手调查数千中国家庭的收入和资产,当时他只有一个谨慎的目的:补充中国经济生活的匮乏信息。
那时,能够反映国家真实现状的详尽入户调查信息几乎没有。“中国的经济学、金融学研究缺乏微观数据,这促使我致力于推动中国家庭金融调查与研究中心的成立。”甘犁在接受《科学新闻》记者采访时说,现在的他穿梭于美国得克萨斯农工大学和中国西南财经大学。他说,自己的项目——中国家庭金融调查——是当时中国家庭收入信息的唯一来源。
不过,甘犁和同事公布了自己计算的中国基尼系数后,他平静的研究生活被打破。
解构数据
基尼系数(或称洛伦茨系数)是20世纪初意大利经济学家基尼根据洛伦茨曲线提出的衡量收入分配差异程度的一个指标,通常用字母G表示,其值在0和1之间。G越小,表明收入分配越是趋向平等,反之,收入分配越是趋向不平等。一般认为,0.4以上的G值表示收入差距较大,当G值达到0.6时,则表示收入悬殊。
2000年,国家统计局公布中国基尼系数为0.41。但是,去年12月,甘犁得出的数值为0.61。不过国家统计局驳斥了甘犁的结论,理由是其样本偏小,并且雇佣初学者进行调查。
数月后,国家统计局公布了自己的中国基尼系数估算结果:0.47。今年1月,马建堂在新闻发布会上表示,这个基尼系数不算低,这说明中国加快收入分配改革、缩小收入差距具有紧迫性,而基尼系数自2008年0.491的最高位逐年回落,则揭示了自2008年金融危机以后,各级政府采取了惠及民生的若干强有力的措施。
两个数据存在不小的差距,引得众人议论纷纷。但是无论如何“研究界确实需要数据用于研究。”北京大学中国经济研究中心经济学家赵耀辉(音译)说。
在中国,数据的准确性和可用性因领域不同而存在很大差异。一些问题反复出现:情况瞒报或过度渲染,以及数据并不公开等。随着社会学和经济学的快速发展,这些问题更加紧迫。赵耀辉指出,无法获得良好数据成为“中国社会科学发展的一个极大障碍”。
中国现存问题的根源部分是系统性的。香港科技大学中国统计学研究专家Carsten Holz表示,在一个数字驱动的国家,中国有一个“较为集中的行政体系收集各方面数据”。
近年来,一些地方政府在统计数据上弄虚作假的事件屡见报端。这类“官出数字、数字出官”的考核机制弊端现象,一再引起政府的警惕及社会的普遍关注。去年,马建堂在局务会议上称,在统计数据上弄虚作假是统计领域最大的腐败,是对政府公信力最大的影响,坚决惩治和积极预防在统计上弄虚作假是统计系统廉政建设的首要任务。
如果每年或每月定期公布数据,美国北卡罗来纳大学人口统计学家Yong Cai指出,“就很难以系统化的方式伪造数据而不会被抓。”相反,政府可以改变定义,这样本年度的数据与上年度的数据将不具有可比性。“地方官员只能操作少量灰色区域,而非全部捏造。”华盛顿大学地理学家Kam Wing Chan说。
影响广泛
对于那些追求精确数据的学者而言,统计数据存在的诸多问题让他们大为恼火。作为政治激励的结果,“所有的幸福指标”都值得怀疑,美国密歇根大学社会学家Yu Xie说。例如判定人均国内生产总值(GDP)或失业率,相关方面可能会排除数百万流动人员,因为流动人口并不被计算入当地人口总数内。Chan表示,一旦他们被记入总人口,当地的数据会极大改变。
在深圳,当流动人口不计入当地人口时,2000年该城市的人均GDP约为21700美元。而当他们被计人时,Chan发现一篇论文称,这一数字骤减至3900美元。
另外,隐瞒信息加剧了中国数据统计存在的问题。例如计划生育政策的限制,使得一些父母并不为其第二个和第三个孩子登记户口,这使得人口学家统计人口变化举步维艰。
“如果需要适时数据,那你必须依靠地方数据,但是这些数据往往并不可靠。”Cai说。这样一来,为了得到更精确的出生率,人口学家需要等待数年,到入学注册开始时,看是否有未登记的适龄儿童出现。
另外,统计数据是国家宏观调控和科学决策管理的重要依据,是社会公众判断形势、从事经济社会活动的重要参考,虚假数据往往影响广泛。以经济数据造假为例,中国金融智库研究员杨国英在接受媒体采访时表示,“它的危害甚大,不仅会造成决策层对经济形势的误判,而且还会使地方政府痴迷于做表面文章。所谓‘失之毫厘,谬之千里’,决策层基于地方政府经济数据的虚报,所制定的相关政策制度,很容易会与经济现实状况严重脱节。”
统计数据的影响往往并不囿于国内。
各国政府通常认为,统计数据是“一旦落入不法之手就极为危险的”研究工具之一。因此,详细地形图和全球定位系统设备受到严密管制。但是隐瞒数据可能对全球研究产生极大影响。因为联合国和世界银行编撰的全球索引通常包含各国政府提交的数据,错误数据会扭曲全球对比结果。
多方共进
“国家统计部门也在努力提升数据质量。”甘犁说,“我认为国家尤其是自然科学基金应该支持独立的调查机构。”一方面,独立的调查机构可以弥补统计局调查的不全面之处。例如,关于中国家庭资产的调查可以填补国情的一个关键的空白。另一方面,独立的调查机构可以对国家已有的数据进行核实。第三点,独立的调查机构也对国家统计局的工作起到竞争的作用,促进国家统计局的工作。
政府部门在解决统计工作存在的问题方面,应扮演主要角色。“第一,国家统计局公布其微观数据,让学术界和社会各界对数据质量进行探讨和监督。第二,允许并支持独立调查机构的工作。”甘犁表示。
另外,越来越多的学者希望能够改变现状。中国家庭金融调查是若干致力于制作独立微级数据的机构之一。
在过去的5年里,许多全国性调查在中国不断涌现,以弥补统计数据存在的漏洞。其中包括,由中国人民大学国家调查研究中心牵头、集中调查国;民宗教、社会不平等和健康等问题的中国综合社会调查,北京大学实施的涵盖从儿童保育到选举权等多方面问题的中国家庭动态跟踪调查,以及同样由北京大学牵头的中国健康与养老追踪调查。
无论是大学还是政府科学机构,社会科学研究投入的增长落后于调查的新浪潮。中国健康与养老追踪调查项目主要负责人之一的赵耀辉表示,她的调查涵盖17500名45岁以上的受调查者,旨在收集一套代表中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析中国人口老龄化问题,推动老龄化问题的跨学科研究。2012年,中国自然科学基金委提供了81.3万美元的启动资金。该项目计划调查结束一年后,数据将对学术界开放,这远快于其他国家的同类调查研究。
这些独立调查能够“用于检验和校正政府的统计数据”,参与中国家庭动态跟踪调查设计的Xie说。
甘犁也计划于7月份启动一项新调查,新调查的样本数量将扩大50%。“正在进行的调查包括对2011年8438受访户的回访,同时还包括18000户新样本。目前项目正在顺利进行。估计到8月底能够完成入户工作。这一轮调查的问卷与2011年的问卷很接近,涉及家庭结构、收入、资产、消费、保险、保障等信息。”甘犁告诉记者。
甘犁还表示,新调查将帮助人们了解中国家庭资产、收入等方面的动态变化,同时因为样本的扩大,全国各个省、市、自治区均有代表性,信息量也更为全面,有利于政策及学术研究,也有利于国I青的掌握。
华南理工大学公共管理学院副教授喻锋指出,遏制数据造假必须多举并用、多管齐下进行治理,消除造假动机、提高造假成本等。
无论如何,就像马建堂所说的,“让我们携起手来,共同保障统计数据的真实性和准确性,共同促进经济实实在在、没有水分的增长”。
此前,国家统计局也曾曝光包括广东省中山市横栏镇在内的多个地方的统计弄虚作假行为。实际上,统计数据存在的各种问题一直是中国的“隐痛”。
2009年,中国经济学家甘犁开始着手调查数千中国家庭的收入和资产,当时他只有一个谨慎的目的:补充中国经济生活的匮乏信息。
那时,能够反映国家真实现状的详尽入户调查信息几乎没有。“中国的经济学、金融学研究缺乏微观数据,这促使我致力于推动中国家庭金融调查与研究中心的成立。”甘犁在接受《科学新闻》记者采访时说,现在的他穿梭于美国得克萨斯农工大学和中国西南财经大学。他说,自己的项目——中国家庭金融调查——是当时中国家庭收入信息的唯一来源。
不过,甘犁和同事公布了自己计算的中国基尼系数后,他平静的研究生活被打破。
解构数据
基尼系数(或称洛伦茨系数)是20世纪初意大利经济学家基尼根据洛伦茨曲线提出的衡量收入分配差异程度的一个指标,通常用字母G表示,其值在0和1之间。G越小,表明收入分配越是趋向平等,反之,收入分配越是趋向不平等。一般认为,0.4以上的G值表示收入差距较大,当G值达到0.6时,则表示收入悬殊。
2000年,国家统计局公布中国基尼系数为0.41。但是,去年12月,甘犁得出的数值为0.61。不过国家统计局驳斥了甘犁的结论,理由是其样本偏小,并且雇佣初学者进行调查。
数月后,国家统计局公布了自己的中国基尼系数估算结果:0.47。今年1月,马建堂在新闻发布会上表示,这个基尼系数不算低,这说明中国加快收入分配改革、缩小收入差距具有紧迫性,而基尼系数自2008年0.491的最高位逐年回落,则揭示了自2008年金融危机以后,各级政府采取了惠及民生的若干强有力的措施。
两个数据存在不小的差距,引得众人议论纷纷。但是无论如何“研究界确实需要数据用于研究。”北京大学中国经济研究中心经济学家赵耀辉(音译)说。
在中国,数据的准确性和可用性因领域不同而存在很大差异。一些问题反复出现:情况瞒报或过度渲染,以及数据并不公开等。随着社会学和经济学的快速发展,这些问题更加紧迫。赵耀辉指出,无法获得良好数据成为“中国社会科学发展的一个极大障碍”。
中国现存问题的根源部分是系统性的。香港科技大学中国统计学研究专家Carsten Holz表示,在一个数字驱动的国家,中国有一个“较为集中的行政体系收集各方面数据”。
近年来,一些地方政府在统计数据上弄虚作假的事件屡见报端。这类“官出数字、数字出官”的考核机制弊端现象,一再引起政府的警惕及社会的普遍关注。去年,马建堂在局务会议上称,在统计数据上弄虚作假是统计领域最大的腐败,是对政府公信力最大的影响,坚决惩治和积极预防在统计上弄虚作假是统计系统廉政建设的首要任务。
如果每年或每月定期公布数据,美国北卡罗来纳大学人口统计学家Yong Cai指出,“就很难以系统化的方式伪造数据而不会被抓。”相反,政府可以改变定义,这样本年度的数据与上年度的数据将不具有可比性。“地方官员只能操作少量灰色区域,而非全部捏造。”华盛顿大学地理学家Kam Wing Chan说。
影响广泛
对于那些追求精确数据的学者而言,统计数据存在的诸多问题让他们大为恼火。作为政治激励的结果,“所有的幸福指标”都值得怀疑,美国密歇根大学社会学家Yu Xie说。例如判定人均国内生产总值(GDP)或失业率,相关方面可能会排除数百万流动人员,因为流动人口并不被计算入当地人口总数内。Chan表示,一旦他们被记入总人口,当地的数据会极大改变。
在深圳,当流动人口不计入当地人口时,2000年该城市的人均GDP约为21700美元。而当他们被计人时,Chan发现一篇论文称,这一数字骤减至3900美元。
另外,隐瞒信息加剧了中国数据统计存在的问题。例如计划生育政策的限制,使得一些父母并不为其第二个和第三个孩子登记户口,这使得人口学家统计人口变化举步维艰。
“如果需要适时数据,那你必须依靠地方数据,但是这些数据往往并不可靠。”Cai说。这样一来,为了得到更精确的出生率,人口学家需要等待数年,到入学注册开始时,看是否有未登记的适龄儿童出现。
另外,统计数据是国家宏观调控和科学决策管理的重要依据,是社会公众判断形势、从事经济社会活动的重要参考,虚假数据往往影响广泛。以经济数据造假为例,中国金融智库研究员杨国英在接受媒体采访时表示,“它的危害甚大,不仅会造成决策层对经济形势的误判,而且还会使地方政府痴迷于做表面文章。所谓‘失之毫厘,谬之千里’,决策层基于地方政府经济数据的虚报,所制定的相关政策制度,很容易会与经济现实状况严重脱节。”
统计数据的影响往往并不囿于国内。
各国政府通常认为,统计数据是“一旦落入不法之手就极为危险的”研究工具之一。因此,详细地形图和全球定位系统设备受到严密管制。但是隐瞒数据可能对全球研究产生极大影响。因为联合国和世界银行编撰的全球索引通常包含各国政府提交的数据,错误数据会扭曲全球对比结果。
多方共进
“国家统计部门也在努力提升数据质量。”甘犁说,“我认为国家尤其是自然科学基金应该支持独立的调查机构。”一方面,独立的调查机构可以弥补统计局调查的不全面之处。例如,关于中国家庭资产的调查可以填补国情的一个关键的空白。另一方面,独立的调查机构可以对国家已有的数据进行核实。第三点,独立的调查机构也对国家统计局的工作起到竞争的作用,促进国家统计局的工作。
政府部门在解决统计工作存在的问题方面,应扮演主要角色。“第一,国家统计局公布其微观数据,让学术界和社会各界对数据质量进行探讨和监督。第二,允许并支持独立调查机构的工作。”甘犁表示。
另外,越来越多的学者希望能够改变现状。中国家庭金融调查是若干致力于制作独立微级数据的机构之一。
在过去的5年里,许多全国性调查在中国不断涌现,以弥补统计数据存在的漏洞。其中包括,由中国人民大学国家调查研究中心牵头、集中调查国;民宗教、社会不平等和健康等问题的中国综合社会调查,北京大学实施的涵盖从儿童保育到选举权等多方面问题的中国家庭动态跟踪调查,以及同样由北京大学牵头的中国健康与养老追踪调查。
无论是大学还是政府科学机构,社会科学研究投入的增长落后于调查的新浪潮。中国健康与养老追踪调查项目主要负责人之一的赵耀辉表示,她的调查涵盖17500名45岁以上的受调查者,旨在收集一套代表中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析中国人口老龄化问题,推动老龄化问题的跨学科研究。2012年,中国自然科学基金委提供了81.3万美元的启动资金。该项目计划调查结束一年后,数据将对学术界开放,这远快于其他国家的同类调查研究。
这些独立调查能够“用于检验和校正政府的统计数据”,参与中国家庭动态跟踪调查设计的Xie说。
甘犁也计划于7月份启动一项新调查,新调查的样本数量将扩大50%。“正在进行的调查包括对2011年8438受访户的回访,同时还包括18000户新样本。目前项目正在顺利进行。估计到8月底能够完成入户工作。这一轮调查的问卷与2011年的问卷很接近,涉及家庭结构、收入、资产、消费、保险、保障等信息。”甘犁告诉记者。
甘犁还表示,新调查将帮助人们了解中国家庭资产、收入等方面的动态变化,同时因为样本的扩大,全国各个省、市、自治区均有代表性,信息量也更为全面,有利于政策及学术研究,也有利于国I青的掌握。
华南理工大学公共管理学院副教授喻锋指出,遏制数据造假必须多举并用、多管齐下进行治理,消除造假动机、提高造假成本等。
无论如何,就像马建堂所说的,“让我们携起手来,共同保障统计数据的真实性和准确性,共同促进经济实实在在、没有水分的增长”。