论文部分内容阅读
过去40多年来,经济学的研究范式由定性分析为主逐渐转变为以数据驱动的定量实证分析为主。大数据在经济学研究的应用被称为实证研究的又一次革命。海量的数据为研究经济问题提供了新素材、新理论和新方法。大数据革命为经济学的定量实证研究开拓了更加广阔的空间,也推动了经济学与自然科学、其他人文社会科学的交叉融合。
一、大数据的特点
一是数据规模大。数据规模是传统计量分析数据的几十倍,乃至上百倍。由于其巨大的规模,对于细分人群的研究仍有足够的样本量使用计量分析方法,如哈佛大学的Chetty教授团队,通过综合美国人口普查简表、联邦所得税申报表和美国社区调查,构造了“机会地图集”(Opportunity Atlas)以研究美国不同人群的机会平等问题,分析维度包括性别、年份、种族、社区等。
二是时效性更强。大数据相比传统统计数据时效性更强。有的大数据可以提供逐小时、逐分钟的海量数据,有些甚至是实时数据,如实时交通数据、实时气象数据等。对这些高速动态的数据信息进行不间断地获取、传输和处理,可以大大提升数据的价值。
三是数据类型更丰富。大数据的种类多样,来源丰富。数据类型既可以是结构化的,也可以是非结构化的,如POS机、电商平台的结构化交易数据,以及网络浏览记录等行为数据,非结构化数据主要是文本、图形、音视频等新型数据流。这些新型数据提供了传统数据没有的丰富信息,为文本分析提供了数据来源。此外,大数据的来源还包括智能设备收集的数据,如智能手机、智能穿戴设备,以及机器和传感器传输的数据。新型数据为计量经济建模提供了更大的灵活性,也带来了所谓“维度灾难”的挑战。
二、现有国际贸易研究中的数据问题
现有国际贸易研究的数据来源包括:各国海关和统计部门发布的官方统计数据、国际组织发布的综合数据库、研究机构和大学发布的专题数据库。这些数据有的是报告数据,有的是抽样调查数据,还有一些是利用模型估算的数据。数据的质量又因各国的统计准则和统计能力的不同而千差万别。
这些差异产生了一系列数据问题。第一,由于国际贸易涉及两个国家间的交易,理论上一国从另一国进口的某种商品的进口额应该等于贸易伙伴对该种商品的出口额。然而,在国际贸易统计中,两者不一致的情况是普遍现象。第二,各国和国际组织关于特定商品和服务的统计准则和口径也不尽相同,使得不同来源的统计数据之间无法比较。第三,服务贸易的统计误差往往高于货物贸易。尽管世界贸易组织发布了《国际贸易统计手册》作为各国统计的指导,然而,许多国家服务贸易特别是细分部门的数据缺失严重,可靠性差。第四,对于数字贸易的统計存在困难。一方面是各国及研究机构对数字贸易的统计口径并未达成一致;另一方面,由于数字贸易中数字服务本身的特点导致部分数字贸易难以识别,更难以统计。
三、大数据如何影响国际贸易研究
(一)提供精度更高、更复杂的贸易数据
首先,数据规模更大,更细分,也更精确。大数据可以有效避免一般统计数据和报告数据的误差,实现精确的数据采集。大数据可以根据商品和服务的属性收集更细分的贸易流数据,并对出口地和进口地更精确地统计。同时,大数据的来源更多样,与贸易相关的数据包括物流数据、跨境电商平台数据、纳税记录、互联网支付数据等都可以包含在大数据内。这些类型的数据为国际贸易研究提供了更加丰富的数据素材,也增加了数据之间的关联性和可靠性。
其次,大数据可以提供原来难以统计的贸易数据,特别是关于服务贸易、数字贸易以及跨境投资的贸易活动数据。例如,目前对建筑服务中建筑材料和服务的区分较为困难,一般采用按比例简单分配原则,而数字化管理获得的大数据使得这类情况得到改善。在国家层面,各国双边镜像贸易和投资数据不相符的问题也有望得到缓解。
再次,大数据可以提供与情感相关的数据。由于大数据的类型比较丰富,包括文本、视频、音频等。大数据可以通过机器学习分析出与人类情绪相关的指标。国际贸易是人类活动的一部分,与人的情绪息息相关,如一些体育赛事的结果经常会影响对特定商品和服务的需求。因此,基于大数据研究媒体报道和国际舆论对于国际贸易和投资的影响,将为相关研究拓展新的空间。
(二)更好地识别因果关系和更精准的预测
经济学研究注重变量之间的因果关系和作用机理。大数据库有利于经济学研究从海量的观察数据中挖掘不易察觉的模式、趋势、关联和因果效应,对经济学研究具有重要的意义。基于大数据的机器学习可以从数据中识别和测度政策干预的效果,并以此完成预测任务。Neyman-Rubin反事实框架的重要应用领域是政策评估。反事实不能被观测到,为了获得估计值,利用大数据对于实施政策前经济变量之间存在的数理关系进行拟合,寻找相关性,再假设这些数量关系不变,外推样本外的反事实估计结果,实际观察到的政策实施后的结果与反事实结果之差,即为因果效应。在国际贸易领域,可以通过基于反事实估计的样本外预测评估贸易政策的效果,从而更好地服务于贸易谈判和贸易政策的制定。
(三)拓展国际贸易理论研究,促进多学科融合发展
大数据拓展了国际贸易的理论研究。数据作为新的生产要素,丰富了比较优势的内涵。传统的比较优势理论集中在劳动力、资本、技术等要素,当数据成为生产要素时,数据的产生和处理能力就成为新的比较优势的来源。此外,微观大数据推动了国际贸易理论在微观层面的理论和实证分析。哈佛大学的Melitz教授使用企业微观数据,将贸易理论下沉到单个企业,并以此为基础,开创了新新贸易理论。
大数据中的文本数据促进了经济学与自然科学和其他人文社会科学的融合,推动了跨学科研究。比如,通过对社交媒体上的非结构化数据进行文本分析,构建新指标,考察公众舆论对经济活动可能产生的影响。目前的国际贸易研究中广泛使用的引力方程包含的人文因素的变量还比较简单,如共同语言、殖民历史等。大数据能够提供更多维度的数据,未来引力方程可以将社会心理、历史事件、公众舆论等人文因素纳入到模型当中。
四、促进大数据在国际贸易研究中应用的建议
(一)中国应积极参与制定与网络和数据相关的国际规则
在大数据时代,中国应积极参与制定双边、区域和多边框架下,有关数据的收集、协调和跨国流动的国际规则,推动各国在保障合法公共政策目标的前提下,确保全球信息和数据自由流动。中国应加快完善围绕大数据收集、使用和流动的国内相关法律法规和监管体系,并以国内的法律法规推动国际规则谈判中的立场和主张。
(二)探索合适的数据资源获取机制
如何促进大数据在国际贸易领域研究中的应用,解决好大数据的可获得性问题是至关重要的。目前,政府部门和私营公司是大数据的主要垄断者。以合适的方式获得行政数据和私营企业数据对研究人员是一个巨大的挑战。在保证数据安全和公众隐私、机构利益的前提下,探索和建立研究人员使用大数据资源的机制和渠道,以达到更有效地利用政府、公共机构、私营公司采集的数据的目的。
(三)加大相关研究领域的科研投入
大数据原本是计算机领域的术语,近十多年来,大数据才逐渐在经济学研究中得到应用。基于大数据的研究是一个跨学科的复杂工作,融合了多种学科的前沿知识,这对研究人员的科研能力提出了更高的要求。应加大对大数据在国际贸易相关领域研究的投入,为研究人员创造学习和研究的机会,提高其数据管理和编程能力,以更好地应对处理和分析大数据带来的挑战。
(作者单位:中国社会科学院大学)
一、大数据的特点
一是数据规模大。数据规模是传统计量分析数据的几十倍,乃至上百倍。由于其巨大的规模,对于细分人群的研究仍有足够的样本量使用计量分析方法,如哈佛大学的Chetty教授团队,通过综合美国人口普查简表、联邦所得税申报表和美国社区调查,构造了“机会地图集”(Opportunity Atlas)以研究美国不同人群的机会平等问题,分析维度包括性别、年份、种族、社区等。
二是时效性更强。大数据相比传统统计数据时效性更强。有的大数据可以提供逐小时、逐分钟的海量数据,有些甚至是实时数据,如实时交通数据、实时气象数据等。对这些高速动态的数据信息进行不间断地获取、传输和处理,可以大大提升数据的价值。
三是数据类型更丰富。大数据的种类多样,来源丰富。数据类型既可以是结构化的,也可以是非结构化的,如POS机、电商平台的结构化交易数据,以及网络浏览记录等行为数据,非结构化数据主要是文本、图形、音视频等新型数据流。这些新型数据提供了传统数据没有的丰富信息,为文本分析提供了数据来源。此外,大数据的来源还包括智能设备收集的数据,如智能手机、智能穿戴设备,以及机器和传感器传输的数据。新型数据为计量经济建模提供了更大的灵活性,也带来了所谓“维度灾难”的挑战。
二、现有国际贸易研究中的数据问题
现有国际贸易研究的数据来源包括:各国海关和统计部门发布的官方统计数据、国际组织发布的综合数据库、研究机构和大学发布的专题数据库。这些数据有的是报告数据,有的是抽样调查数据,还有一些是利用模型估算的数据。数据的质量又因各国的统计准则和统计能力的不同而千差万别。
这些差异产生了一系列数据问题。第一,由于国际贸易涉及两个国家间的交易,理论上一国从另一国进口的某种商品的进口额应该等于贸易伙伴对该种商品的出口额。然而,在国际贸易统计中,两者不一致的情况是普遍现象。第二,各国和国际组织关于特定商品和服务的统计准则和口径也不尽相同,使得不同来源的统计数据之间无法比较。第三,服务贸易的统计误差往往高于货物贸易。尽管世界贸易组织发布了《国际贸易统计手册》作为各国统计的指导,然而,许多国家服务贸易特别是细分部门的数据缺失严重,可靠性差。第四,对于数字贸易的统計存在困难。一方面是各国及研究机构对数字贸易的统计口径并未达成一致;另一方面,由于数字贸易中数字服务本身的特点导致部分数字贸易难以识别,更难以统计。
三、大数据如何影响国际贸易研究
(一)提供精度更高、更复杂的贸易数据
首先,数据规模更大,更细分,也更精确。大数据可以有效避免一般统计数据和报告数据的误差,实现精确的数据采集。大数据可以根据商品和服务的属性收集更细分的贸易流数据,并对出口地和进口地更精确地统计。同时,大数据的来源更多样,与贸易相关的数据包括物流数据、跨境电商平台数据、纳税记录、互联网支付数据等都可以包含在大数据内。这些类型的数据为国际贸易研究提供了更加丰富的数据素材,也增加了数据之间的关联性和可靠性。
其次,大数据可以提供原来难以统计的贸易数据,特别是关于服务贸易、数字贸易以及跨境投资的贸易活动数据。例如,目前对建筑服务中建筑材料和服务的区分较为困难,一般采用按比例简单分配原则,而数字化管理获得的大数据使得这类情况得到改善。在国家层面,各国双边镜像贸易和投资数据不相符的问题也有望得到缓解。
再次,大数据可以提供与情感相关的数据。由于大数据的类型比较丰富,包括文本、视频、音频等。大数据可以通过机器学习分析出与人类情绪相关的指标。国际贸易是人类活动的一部分,与人的情绪息息相关,如一些体育赛事的结果经常会影响对特定商品和服务的需求。因此,基于大数据研究媒体报道和国际舆论对于国际贸易和投资的影响,将为相关研究拓展新的空间。
(二)更好地识别因果关系和更精准的预测
经济学研究注重变量之间的因果关系和作用机理。大数据库有利于经济学研究从海量的观察数据中挖掘不易察觉的模式、趋势、关联和因果效应,对经济学研究具有重要的意义。基于大数据的机器学习可以从数据中识别和测度政策干预的效果,并以此完成预测任务。Neyman-Rubin反事实框架的重要应用领域是政策评估。反事实不能被观测到,为了获得估计值,利用大数据对于实施政策前经济变量之间存在的数理关系进行拟合,寻找相关性,再假设这些数量关系不变,外推样本外的反事实估计结果,实际观察到的政策实施后的结果与反事实结果之差,即为因果效应。在国际贸易领域,可以通过基于反事实估计的样本外预测评估贸易政策的效果,从而更好地服务于贸易谈判和贸易政策的制定。
(三)拓展国际贸易理论研究,促进多学科融合发展
大数据拓展了国际贸易的理论研究。数据作为新的生产要素,丰富了比较优势的内涵。传统的比较优势理论集中在劳动力、资本、技术等要素,当数据成为生产要素时,数据的产生和处理能力就成为新的比较优势的来源。此外,微观大数据推动了国际贸易理论在微观层面的理论和实证分析。哈佛大学的Melitz教授使用企业微观数据,将贸易理论下沉到单个企业,并以此为基础,开创了新新贸易理论。
大数据中的文本数据促进了经济学与自然科学和其他人文社会科学的融合,推动了跨学科研究。比如,通过对社交媒体上的非结构化数据进行文本分析,构建新指标,考察公众舆论对经济活动可能产生的影响。目前的国际贸易研究中广泛使用的引力方程包含的人文因素的变量还比较简单,如共同语言、殖民历史等。大数据能够提供更多维度的数据,未来引力方程可以将社会心理、历史事件、公众舆论等人文因素纳入到模型当中。
四、促进大数据在国际贸易研究中应用的建议
(一)中国应积极参与制定与网络和数据相关的国际规则
在大数据时代,中国应积极参与制定双边、区域和多边框架下,有关数据的收集、协调和跨国流动的国际规则,推动各国在保障合法公共政策目标的前提下,确保全球信息和数据自由流动。中国应加快完善围绕大数据收集、使用和流动的国内相关法律法规和监管体系,并以国内的法律法规推动国际规则谈判中的立场和主张。
(二)探索合适的数据资源获取机制
如何促进大数据在国际贸易领域研究中的应用,解决好大数据的可获得性问题是至关重要的。目前,政府部门和私营公司是大数据的主要垄断者。以合适的方式获得行政数据和私营企业数据对研究人员是一个巨大的挑战。在保证数据安全和公众隐私、机构利益的前提下,探索和建立研究人员使用大数据资源的机制和渠道,以达到更有效地利用政府、公共机构、私营公司采集的数据的目的。
(三)加大相关研究领域的科研投入
大数据原本是计算机领域的术语,近十多年来,大数据才逐渐在经济学研究中得到应用。基于大数据的研究是一个跨学科的复杂工作,融合了多种学科的前沿知识,这对研究人员的科研能力提出了更高的要求。应加大对大数据在国际贸易相关领域研究的投入,为研究人员创造学习和研究的机会,提高其数据管理和编程能力,以更好地应对处理和分析大数据带来的挑战。
(作者单位:中国社会科学院大学)