论文部分内容阅读
概念厘清
(一)数据的定义
探讨“数据资产”,我们首先要理解什么是数据。维基百科中把数据(Data)定义为通过观测得到的数字性的特征或信息。但是,这个概念并不准确。广义来看,数字可以是数据;狭义来看,数字是具有数量意义的符号,基于数字能够进行代数运算。而数据是我们利用某些约定的方式对客观世界进行记录和表达的产物,可以是定性的,也可以是定量的,数字只是其中的一种呈现方式。除了数字以外,我们还可以通过文本、图形、声音等格式对数据加以呈现。因此,数据与数字并不等同。同样,数据与信息也是两个不同的概念。数据是信息的表现形式和载体,数据经过加工处理后得到信息;信息依赖数据来表达,同时又赋予数据以含义。当然,数据本身也可以成为信息。除了数据与数字、数据与信息外,我们还要进一步区分数据与信号。信号也可以是信息的载体,信号在既有知识经验框架或手册下经过转换形成信息。但是,信号与数据最大的差别在于,信号主要表现为信息发送和接收的载体,而数据主要是信息存储的载体,故我们可以把信号认为是结构化的数据形式。考虑到在新业务模式下,数据主要以电子化的方式呈现。因此,我们进一步将数据的定义狭义化,认为数据是对客观世界进行的电子化的记录和表达。
(二)资产的定义
理解了什么是数据后,我们要接着弄清楚什么是资产。需要明确的一点是,本文涉及的资产要素的定义以新概念框架为基准。国际会计准则理事会(IASB)在2018年发布的新修订的《财务报告概念框架》中把财务报表要素之“资产”定义为“由于过去事项所导致的、由主体控制的现时经济资源”,其中,“经济资源是指有潜力产生经济利益的权利”。与之不同,旧的财务概念框架中则把资产要素定义为“由于过去事项而由主体控制的、预期会导致未来经济利益流入主体的资源”。两者最大的区别在于,旧概念框架的关注点在于经济利益的最终流入,而新概念框架则淡化了对经济利益流入可能性的标准,明确定义资产是经济资源,将资产聚焦于主体控制的权利,实现了资产的实质由实物资产向权利的转变(陆建桥,2018)。这一点对于我们后面具体分析“数据资产”概念是非常重要的。
基于上述分析,如果粗糙地把数据和资产的定义组合在一起,我们可以简单地认为数据资产就是以电子化形态对客观世界进行记录和表达的资产。但是,在对数据资产进行定义时我们首先应该解决的问题是到底能不能把数据作为一项资产?其次才是解决如何对数据资产进行定义的问题。数据是资产,听起来似乎很有道理,实则经不起推敲。而现有很多文献在探讨所谓的数据资产时,往往都忽略了这一点,直接就把数据默认为一项资产去探讨它的确认和计量问题,这是不恰当甚至是严重错误的。
数据资产化的基本前提
首先,数据满足“由过去事项所导致的”这一界定。对于企业来说,大部分数据是由过去的生产经营活动带来的。但是,由企业过去事项所产生的数据却未必是企业所控制的现时经济资源。假设我们把数据当作一项资产,那么根据资产要素的定义,数据资产必须是由主体控制的有潜力产生经济利益的权利。由此引出的一系列问题是,产生经济利益的权利是以何种形式存在的?仅仅是使用权是否足够?谁是控制权利的主体?是企业,还是每一条数据对应的个体?如果是企业,那么企业是否真的有权力控制数据,尤其是涉及个体隐私的部分?如果是个体,那么个体的数据是否真的具有价值?再者,数据如何为控制它的主体带来经济利益?尽管大众普遍认可数据的商业价值,国内目前出现了不少的数据交易中心,比如贵阳大数据交易所、上海数据交易中心、京东万象、数据宝等专业机构或平台,但是否所有数据都能够带来经济利益也是值得商榷的。因此,数据资产化有三个重要前提,一是清晰地定义控制的主体,二是明确主体控制的权利,三是判断数据产生经济利益的潜力。
本文主要从企业主体的角度出发探讨数据是否能够被定义为一项资产。
(一)企业控制的数据类型
要验证上述条件,我们首先要回答的问题是企业是否有权力(power)控制数据,以及控制的是什么样的权利(rights)?前者等价于判断企业的控制是否合法合规,而后者主要是限定权利的范围。根据概念框架,控制至少需要满足三个要求,一是企业有能力直接使用这项数据,二是企业有能力从中获取可变的回报,三是企业行使上述两种权利是合法的。当企业同时满足这三个要求时,我们认为企业控制与数据相关的权利。需要額外指出的是,控制具有排他性,当一家企业对数据拥有控制权时,一定不存在任何其他企业对该数据也同时拥有控制权,这意味着控制主体的单一性。
1. 权利的表现形式
权利可能表现为多种形式。和法律中的权利与义务的关系不同,新概念框架指出,一个主体拥有的权利可能对应于另一个主体的义务,也可能并不与之相对应。与另一个主体的义务相对应的权利包括收取现金、接受货物或服务、以优惠条件与另一方交换经济资源,或者在未来某一特定的不确定事项发生时从另一方的经济资源转让义务中获利等权利;而不与另一方的义务相对应的权利主要包括使用有形资产或者无形资产等权利。由于权利的行使离不开对数据的使用,而行使权利的最终目的又是为了获取经济利益。因此,我们将与数据相关的权利归纳为“直接使用权”和“收益权”,对应于上一段中提到的“企业有能力使用这项数据”且“有能力从中获取可变的回报”两个要求。
企业如果有能力通过“收现”、“收货”、“交换”或“使用资产”中的一种或多种方式确保自身能够使用数据并获取收益,则说明企业控制了与数据相关的直接使用权和收益权,满足控制的要求(需要指出的是,控制权并不等于所有权,这意味着企业控制的某类数据的所有权可能是归属于其他方的)。 2. 权利实现的途径
假定企业有能力行使对数据的直接使用权和收益权,进一步地,我们需要判断企业是否有权力去行使这两项权利。而企业是否有权力控制数据首先涉及到数据的权利归属问题。在法学界,已经有很多学者对数据的权属问题展开了讨论,但也并未达成共识。
由于不同类型的数据其权利归属是不同的,因此,企业并不是对所有类型的数据都有权力控制。目前,有关数据类型最主流的划分方式是按照数据的产生主体(输出主体)将其划分为个人数据、政府数据和商业数据三类。所谓个人数据,是指“与个人相关、能够识别个人身份的数据”,由于个人数据中包含了与姓名权、隐私权相关的人格权的内容,故其权属应当属于个人,而与企业无关。所谓政府数据,是指“政务部门在履职过程中获取或制作的数据”。其中,就公开的政府数據而言,由于公众对其享有知情权、访问权、使用权等,故其权属应当属于公众,但其中若涉及到个人数据仍应当归属于个人;就非公开政府数据而言,其权属应归属于国家,仍与企业无关。由此来看,只有商业数据的直接使用权和收益权可能归属企业,这意味着企业有权力控制的只可能是商业数据。
那么,判断企业是否有权力对商业数据实现上述两项权利有两种渠道,一是看企业是否能够通过合同、立法等手段确保自己行使法定权利的能力,二是看企业是否能够通过其他方式,如创造不属于公有领域的专有技术,确保自己行使权利的能力。根据王融(2016),企业可以通过“知识产权”、“商业秘密”和“市场竞争合法权益”三个法学层面的权利来确保自己有权力实现对数据的直接使用权和收益权。一方面,就企业自身在生产经营过程中产生的、与其他主体无关的商业数据而言,“权力”的判断就相对容易。具体来看,如果是企业发明或发现的具有独创性的成果而言,企业可以通过知识产权的方式来实现经济利益,其实质就等价于我们所说的通过创造专有技术的方式获取控制;如果是涉及企业商业秘密的数据,那么根据《关于禁止侵犯商业秘密行为的规定》、《反不正当竞争法》等商业秘密保护规定,企业也是有权力获取相应的权利的,即使这些数据并不受注册专利或者知识产权的保护,其实质等价于通过国家立法的方式获取控制。但是,控制的排他性也意味着一旦商业秘密遭泄露,其他企业也有能力对该数据行使直接使用权和收益权时,那么企业虽然有权力控制数据,但不再有能力去控制这些商业数据。另一方面,就其他主体在企业生产经营过程中产生、由企业信息系统呈现的商业数据而言,“权力”的判断就相对困难,因为涉及到其他主体的隐私问题,我们无法简单的将上述几种方式带入验证。众所周知,很多大型互联网企业,诸如阿里巴巴、腾讯、百度等,掌握了大量的与用户身份信息、支付交易、社交网络、位置轨迹以及日志浏览相关的可能涉及用户隐私权的数据。这些数据依托于互联网平台产生,既来源于用户的输入行为,又来源于平台信息系统的加工处理和输出行为,产生权益交叉问题。尤其是在个人信息隐私保护问题下,企业对于用户数据的使用权和收益权是受限的,那么企业究竟是否有权力控制这些数据并且有能力行使对数据的直接使用权和收益权?要回答这个问题,我们必须将商业数据再分解为“原生数据”和“衍生数据”(杨立新和陈小江,2016)。其中,衍生数据还可以被进一步拆分为经匿名化处理且不可复原的衍生数据,以及未经匿名化处理或经匿名化处理但可复原的数据(后文统称未经匿名化处理的数据)。
杨立新和陈小江(2016)将原生数据定义为“不依赖于现有的数据而产生的数据”,将衍生数据定义为“原生数据被记录、储存后,经过算法加工、计算、聚合而成的系统的、可读取、有使用价值的数据”。原生数据接近于前文所说的对客观世界进行记录和表达,而衍生数据实际上是在此基础上进行了加工处理,更接近于我们所说的信息。如果是商业原生数据,那么实际上只是企业平台对于用户信息电子化的记录和表达,数据本身涉及用户的隐私。如果是未经匿名化处理的商业衍生数据,那也只是企业平台通过某些算法对已记录的用户数据进行加工后的表达,经过一些复原处理后仍能恢复为原生数据,无法将用户隐私完全抹去。因此,我们无法直接判断这两类数据的权属究竟归属于企业还是用户。本文认为一个可行的方法是区分数据的所有权和使用权。一方面,从源头来看,这两类数据是可以追溯到每一个用户的,企业只是负责采集存储和输出这些数据,因此,原生数据或未经匿名化处理的数据的所有权应当归属于每一个与之对应的用户;另一方面,大部分互联网平台的相关服务都是“免费”提供给用户使用的,企业为采集存储和输出数据投入了大量的资源,没有企业平台的技术及算法处理,用户的每一条数据可能毫无价值可言。因此,原生数据或未经匿名化处理的数据的使用权应当归属于企业。但是,这种使用权应当是合法的,企业只能在获得用户授权的前提下对用户数据进行采集和存储,并通过协议约定的方式将这两类数据内部自用或者间接地为其他方提供服务(数据不传输给其他方,只有企业自身可以读取和使用),而不能将这两类数据直接提供给其他方或用来交易,否则将造成用户隐私泄露等不良后果甚至严重的社会问题。如果是经匿名化处理且不可复原的衍生数据,那么所有权和使用权的讨论不再必要。我们既可以同前面一样认为经匿名化处理且不可复原的衍生数据的所有权归属于用户、使用权归属于企业,也可以认为其所用权和使用权都归属于企业,因为衍生数据经不可复原的匿名化处理后已经隐藏了用户ID,无法再追溯到其对应的每一个用户,所有权也就无从谈起。2017年6月1日实施的《网络安全法》实际上为企业控制这类数据的合法化提供了法律依据,其中第四十二条明确指出“未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。”
因此,基于上述分析,本文认为如果是商业原生数据,那么企业有权力在获得用户授权的前提下将数据用于企业内部或将数据转化为信息后间接的提供给其他方,但没有权力将其用于交易等需要转让数据的活动;如果是商业衍生数据,那么企业既有权力将数据直接自用也有权力转让,取决于企业是否对商业衍生数据进行不可复原的匿名化处理。当企业通过内部自用或外部商业化使用的方式同时拥有对商业数据的直接使用权和收益权时,说明企业控制了该类数据,符合控制的要求。
为了更清晰地理解上述概念,我们以支付宝控制的由其他主体在使用支付宝过程中产生的、但由支付宝信息系统呈现的商业数据为例进行分析。
第一,支付宝可以记录用户“花呗”的还款情况,根据用户是否有不良还款记录及时调整其花呗额度,进而降低未来用户还不上钱的风险,间接地利用原生数据带来经济利益。此时,支付宝控制的数据为商业原生數据。
第二,为了更全面地评价用户的征信情况,支付宝可以结合用户消费、出行、信用卡还款等其他行为,测算每一个用户对应的“芝麻信用分”,并按照用户合同条款约定的用途使用未经匿名化处理的衍生数据为企业创造价值。但是,支付宝不能未经用户同意,直接把用户ID、还款记录以及“芝麻信用分”提供给其他方,这属于非法交易行为,可能造成用户数据的滥用。此时,支付宝控制的数据为未经匿名化处理的商业衍生数据。
第三,如果市场的确对用户的征信得分存在需求,比如某共享汽车企业想要获取我国各地居民的征信情况以判断共享汽车能够率先投入使用的地区,那么支付宝必须将用户的ID隐去,利用当地用户的芝麻信用分测算出一个地方综合征信水平,当这种模糊行为做得足够好时,经匿名化处理且不可复原的衍生数据便是可以交易并为支付宝带来收入的。此时,支付宝控制的数据为经匿名化处理且不可复原的衍生数据。另外,由于用户自身并没有办法直接使用此类数据和创造收益,故也满足控制的排他性要求。
(二) 有潜力为企业带来经济利益的数据类型
接着,我们进一步探讨数据是否有潜力为企业带来经济利益,其实质就是探究受符合企业控制要求的商业数据是否具有商业价值。如果企业控制的商业数据有潜力为企业带来经济利益,则满足资产要素的定义。
一方面,权利的执行涉及“成本-收益”约束问题。如果商业数据获取和处理的成本大于其给企业带来的收益,或者说企业无法通过外部商业化使用(数据业务化)或内部自用(业务数据化)的方式将商业衍生数据有效变现,那么这些数据是否有被确认为资产的意义至少是存疑的。另一方面,孤立的数据带来的商业价值是有限的。我们谈到数据时总是会联想到“大数据”,所谓大数据其实是数据的集合,而大数据的核心价值不在于单个用户的数据,而在于对数据集进行样本分析和挖掘。所以,有潜力带来经济利益数据主要体现为数据的集合(需要补充的一点是,经济利益可能是在未来发生的,但是有潜力带来经济利益的权利是现时的不是未来的。当企业可以通过知识产权、商业秘密的方式控制数据时,是满足现时权利的要求的;而当企业通过数据交易等市场竞争合法权益的方式控制数据时,企业可能不具备交易单个用户的数据的能力,因为市场并不需要零碎的数据,此时的权利可能并非是现时的)。但是,新概念框架已经弱化了对经济利益流入的可能性标准,有潜力说明有不确定性存在,即使这种可能性非常低,我们依然可以认为数据能够带来经济利益。另外,数据的价值是动态变化的,有的数据可能在生成后就失去了价值,有的数据则可能因未来持续更新的其他数据而获得价值的增加或者说价值增值,这使得数据有别于传统的资产。因此,只要企业控制的商业数据没有完全丧失价值,那么就可以认为其是有潜力为企业带来经济利益。
从数据的权属视角重新定义“数据资产”
由以上分析可以看出,企业可能控制的数据的类型是商业数据,而非个人数据或政府数据。当企业能够确保对商业数据拥有直接使用的权利和获取全部经济利益的权利,我们认为企业是控制商业数据的主体,有能力控制数据的直接使用权和收益权。但是,当商业数据中涉及到用户的隐私权时,当且仅当企业在内部使用原生数据或衍生数据时获得了用户的授权、在外部交易衍生数据时进行了无法复原的匿名化处理,才能够符合资产中的控制要求。进一步地,如果企业控制的商业数据没有一生成就失去商业价值,则认为其有潜力为企业带来经济利益。因此,本文认为对于企业而言,数据并不一定是资产,只有那些企业在合法合规的前提下有权力、有能力控制的,且有潜力为企业带来商业价值的数据才符合资产要素的定义。
据此,从数据的权属问题出发,我们首先将“数据资产”狭义化为“商业数据资产”。针对那些可以被资产化的商业数据,我们又将其划分为源自企业自身的商业数据和源自其他主体的商业数据。其中,源自企业自身的商业数据资产可以定义为“企业控制的、以电子化形态存在的、源于企业自身的、对客观世界进行记录和表达的资产”,源自其他主体的商业数据资产可以定义为“企业控制的、以电子化形态存在的、源于其他主体且经授权的、能够合法地对客观世界进行记录和表达的资产”。
因此,狭义化的“商业数据资产”其不同于一般意义上的资产,具备了全新的特征。商业化的数据资产本质上存在竞争性。目前学界有观点如熊巧琴和汤珂(2021)认为数据资产具有非竞争性,认为数据资产可以被无限分享与无限复制。但实际上,在商业竞争领域,企业数据资产成为商业竞争的重要基础,不管是市场交易还是其他商业活动,数据资产在参与市场竞争过程中的重要内容,其本质上都存在一定的竞争性。且基于商业活动的数据交易行为背后的隐含逻辑依然是数据资产的竞争属性而非公共属性,此时对于数据资产的产权界定便成为了商业活动中重要的议题。商业数据资产共享的前提是不降低拥有者的经济与社会福利,其共享至少是一个帕累托改进,即不损害共享者、数据提供者等存在产权关系的经济或者社会利益,其共享的价值方能可持续。
结语
自党的十九届四中全会决议将数据划入生产要素的组成部分以来,数据要素在各个生产领域的重要性不断凸显。然而,受限于我国不完善的产权制度以及尚未建立的数据产权界定规则,我国的数据要素市场发育整体较为迟缓。因此,如何加快培育数据要素市场是当前的重点所在。2020年4月9日发布的《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》就上述问题提出了一系列解决办法,例如,推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护等。企业作为数据要素市场的重要参与者,除了关注是否需要确认数据资产以及如何确认数据资产这个问题以外,更重要的还是应当加强数据安全和隐私保护,扮演好数据流通背后的“护航者”角色。尽管如此,从本质上来说,我们首先应解决的还是数据究竟是否是企业的一项资产这个问题。因此,我们需要从资产要素的定义出发来重新审视“数据资产”。
通过上文的讨论和分析,本文提出如下建议。第一,对于企业而言,应当加快推进数字化转型工作,构建便捷安全的数据资产流通渠道和生态网络,但在交易符合资产要素定义的数据过程中应当充分利用好大数据、云计算、物联网等手段,避免发生原始数据泄漏等问题;第二,对于监管机构而言,应当建立起数据泄露惩罚机制,完善数据资产交易的监督管理工作,充分保障数据来源方的利益;第三,对于政策制定者而言,应当加快推进数据资产相关会计准则的制定工作,明确数据资产的确认、计量等会计处理办法以及数据资产的列报和披露要求。此外,政策制定者还应当加快推进数据产权界定、交易流通、安全保护等基础制度和规范的制定工作,为数据资产提供制度保障的同时助力推动数据要素市场化。