论文部分内容阅读
随着物联网、云计算、电子商务等相关信息技术领域的快速发展,由此产生的个人、企业和政府数据呈指数型的速度暴增,大数据时代已经到来。这些数据不仅对商业管理都有着不可估量的价值,而且对学术研究有重要的推动作用。随着数据的激增,数据的价值逐渐显露,数据交易越来越流行,同时出现了众多提供数据和数据产品交易的数据集市,比如Factual、Infochimps和贵阳大数据。目前对大数据的研究主要集中在机器学习算法、资源分配等技术层面,忽视了对大数据背景下的数据产品商业模式和经济分析的研究。目前大部分对数据产品定价的研究没有区分原始数据和数据产品,没有充分考虑数据沿着价值链的增值过程。如何提取数据的价值,开发出满足市场需求的数据产品,提供数据服务;如何衡量数据产品的价值、合理地选择数据产品质量;以及如何制定有效的数据产品投放策略增加利润,当前缺乏可靠的理论指导。随着数据交易的流行,大数据背景下合理的数据市场模型和有效的数据产品定价策略和质量选择问题亟待解决。在这样的背景下,本文将借助数据价值链的思想,对大数据背景下的大数据市场运作流程、数据产品设计及数据产品定价问题进行深入讨论。数据产品设计,即数据产品开发者如何根据数据自身特征制定数据产品;本文主要讨论了3种数据特征,即数据规模、数据质量和多源异构数据集成。主要研究内容和创新性工作如下:
(1)介绍了数据市场的构成和运作模式,描述了数据产品的属性和特征。综合评述了关于信息产品定价、数据价值链、数据产品定价的相关研究。并考虑数据规模的数据产品设计和定价问题,将数据本身的特征应用到数据产品开发和定价过程中。首先,数据规模,即数据服务商所处理的原始数据的数量,是决定数据产品质量和价值的最主要的因素之一,而当前数据市场中的数据产品定价问题研究却鲜有考虑这一因素,因此本文首先从数据规模出发,研究了数据产品质量选择和定价方法。引入了数据产品开发复杂度的概念,建立数据供应商和数据服务商之间的Stackelberg博弈定价模型,并考虑到数据服务商的边际规模成本递增的情形,比较分析了线性和非线性成本模型中开发复杂度对数据产品质量、定价和各参与方决策的影响。研究发现,数据处理规模的增加会提高数据产品的质量,数据供应商会随着数据采购量的增加给数据服各商提供一定的规模折扣。另外,产品开发复杂度的增加,不仅会直接增加数据服务商的成本,而且会间接的影响到数据供应商的收益。
(2)同时考虑数据规模与数据质量的数据产品设计和定价问题。在原始数据规模对数据产品质量和定价产生影响的基础上,考虑了影响数据产品价值的另一重要因素——数据质量,即数据供应商提供的原始数据的质量。并从数据质量的多维度视角,分析数据多个质量维度之间的相互作用对于整体数据质量的影响。在假设数据供应商的边际质量成本增加的基础上,建立非线性的Stackelberg博弈定价模型,并分析了数据质量成本参数对数据产品质量、定价和各参与方决策的影响。研究发现,当数据质量很难提升时,数据供应商并不会试图通过提高价格来弥补损失,而是在满足需求方要求的前提下,适当降低数据的质量水平。
(3)在数据规模和质量的基础上,考虑数据集成的数据产品设计与定价问题。数据产品的开发往往需要从多个数据源收集不同内容和类型的数据,比如百度地图需要地理数据、路况数据、公交地铁数据和各商家信息等多种数据。本文考虑多源异构数据之间的关联性,即数据间隐藏的互补关联知识和数据间冲突,分析多数据供应商、单一数据服务商的大数据市场的运作模式,建立多数据源的Stackelberg博弈定价模型,分析了数据关联性对数据产品质量、定价和数据服务商的决策的影响,并对多数据源和单一数据源下的数据产品质量和数据服务商利润进行了比较分析。研究发现,当数据关联性增加到一定程度时,数据服务商不再追求大规模的单一数据,而是希望从多个数据源获取数据。并且,数据关联性增加会使数据供应商的数据价格和利润受到负面影响,为了通过数据集成开发出开创性的数据产品,需要对数据供应商提供一定的补贴。
本文提出的数据产品的质量选择和定价方法,考虑了数据规模、多维度数据质量和多源异构的数据集成,并给出了数据供应商和数据服务商之间的Stackelberg博弈定价模型,分析了基于数据价值链的大数据市场运作模式、各市场参与方的决策制定过程,有利于建立公平有序的数据交易市场,为数据交易的利益相关者提供决策依据,具有非常重要的理论和实践意义。
(1)介绍了数据市场的构成和运作模式,描述了数据产品的属性和特征。综合评述了关于信息产品定价、数据价值链、数据产品定价的相关研究。并考虑数据规模的数据产品设计和定价问题,将数据本身的特征应用到数据产品开发和定价过程中。首先,数据规模,即数据服务商所处理的原始数据的数量,是决定数据产品质量和价值的最主要的因素之一,而当前数据市场中的数据产品定价问题研究却鲜有考虑这一因素,因此本文首先从数据规模出发,研究了数据产品质量选择和定价方法。引入了数据产品开发复杂度的概念,建立数据供应商和数据服务商之间的Stackelberg博弈定价模型,并考虑到数据服务商的边际规模成本递增的情形,比较分析了线性和非线性成本模型中开发复杂度对数据产品质量、定价和各参与方决策的影响。研究发现,数据处理规模的增加会提高数据产品的质量,数据供应商会随着数据采购量的增加给数据服各商提供一定的规模折扣。另外,产品开发复杂度的增加,不仅会直接增加数据服务商的成本,而且会间接的影响到数据供应商的收益。
(2)同时考虑数据规模与数据质量的数据产品设计和定价问题。在原始数据规模对数据产品质量和定价产生影响的基础上,考虑了影响数据产品价值的另一重要因素——数据质量,即数据供应商提供的原始数据的质量。并从数据质量的多维度视角,分析数据多个质量维度之间的相互作用对于整体数据质量的影响。在假设数据供应商的边际质量成本增加的基础上,建立非线性的Stackelberg博弈定价模型,并分析了数据质量成本参数对数据产品质量、定价和各参与方决策的影响。研究发现,当数据质量很难提升时,数据供应商并不会试图通过提高价格来弥补损失,而是在满足需求方要求的前提下,适当降低数据的质量水平。
(3)在数据规模和质量的基础上,考虑数据集成的数据产品设计与定价问题。数据产品的开发往往需要从多个数据源收集不同内容和类型的数据,比如百度地图需要地理数据、路况数据、公交地铁数据和各商家信息等多种数据。本文考虑多源异构数据之间的关联性,即数据间隐藏的互补关联知识和数据间冲突,分析多数据供应商、单一数据服务商的大数据市场的运作模式,建立多数据源的Stackelberg博弈定价模型,分析了数据关联性对数据产品质量、定价和数据服务商的决策的影响,并对多数据源和单一数据源下的数据产品质量和数据服务商利润进行了比较分析。研究发现,当数据关联性增加到一定程度时,数据服务商不再追求大规模的单一数据,而是希望从多个数据源获取数据。并且,数据关联性增加会使数据供应商的数据价格和利润受到负面影响,为了通过数据集成开发出开创性的数据产品,需要对数据供应商提供一定的补贴。
本文提出的数据产品的质量选择和定价方法,考虑了数据规模、多维度数据质量和多源异构的数据集成,并给出了数据供应商和数据服务商之间的Stackelberg博弈定价模型,分析了基于数据价值链的大数据市场运作模式、各市场参与方的决策制定过程,有利于建立公平有序的数据交易市场,为数据交易的利益相关者提供决策依据,具有非常重要的理论和实践意义。