论文部分内容阅读
在贵阳,有一座互联网金融特区大厦。
它的三楼,是全球第一家大数据交易所“贵阳大数据交易所”(以下简称“贵数所”)。2015年,作为贵州大数据产业的领军项目,这家交易所曾风光一时,引领过全国范围大数据交易所“井喷”的风潮。
当时贵数所许下豪言:在未来3年至5年,交易所日交易额将突破100亿元,预计将诞生一个万亿元级别的交易市场。
然而期限已满,2019年交易所的累计交易额仅有4亿元,与“万亿元”的目标相差甚远。以至于后两年,交易所连数据也不对外公布了。
实际上,这家明星交易所的业务已陷入了停滞状态。而其他地方的交易所,也近况不佳。曾被寄予厚望,获得多方肯定的大数据交易行业蒙上了一层阴影。
业界观点多认为,目前的交易市场偏离了最初设想,本想成为第三方的中间市场,却发现买家和卖家并不依托平台交易,只利用平台实现信息交换的功能。用户的顾虑很多,包括数据交易中的隐私保护、数据确权以及交易定价,这些问题交易所尚未完全解决。
今年,北京国际大数据交易所(以下简称“北数所”)落地,它打着“数据可用不可见,用途可控可计量”新型交易范式的旗号,重新使大数据交易回归公众视野。
就像玻璃后的一块蛋糕,都知道这是一个大市场,都不愿放弃。但想要吃到蛋糕,得找到敲碎玻璃的方法。
曾经的火爆
使用苹果手机的人,对于“云上贵州”这四个字不会陌生。
这是苹果在中国内地运营iCloud服务的唯一企业,2017年打败了三大运营商和多家互联网巨头,才拿到的大单子。
云上贵州的主管单位是贵州省大数据局,它是贵州继发电、采矿等资源型产业“往下走”后,重点发展大数据产业的代表项目。
冬暖夏凉的气候、清洁的空气、稳定的地质结构、水火互济的电力结构和低廉的电价,以及“老三线”建设积累的产业和人才基础,是这个中国西南欠发达省份发展大数据中心的禀赋。
建立全球第一家大数据交易中心的初衷,也与此一脉相承。作为大数据关联产业的一分子,本着推动政府数据公开、行业数据价值发现的主旨,2015年贵阳国资委持股35%,与持股22%的民营企业九次方大数据联合成立了贵阳大数据交易所。
贵州的算盘打得很好,以贵安为中心形成企业数据中心集群,由云上贵州聚集政府数据,通过招商引入各类大数据技术公司负责数据生产,最后贵数所负责所有的交易环节。
彼时,正值大数据产业如日中天之时。2015年8月,国务院正式印发了《促进大数据发展行动纲要》,从国家层面开展大数据产业的顶层设计。紧接着,次年《十三五规划纲要》正式提出国家大数据战略,工信部发布了《大数据产业发展规划(2016-2020年)》。
根据企查查的数据,2015年,大数据及关联产业规模总量达到916亿元,同比增长38%以上,大数据及关联企业工商注册数较2014年增加1300多家。
贵数所起初成绩斐然,成立当日的首批交易中,中金数据、京东、QQ音乐赫然在目。到了年底,贵数所公布交易金额突破6000万元,会员超过300家,接入的数据源公司超过100家,数据总量超过10P。
大数据交易所在国内各地如雨后春笋般铺开,北京、上海、浙江、武汉、黑龙江等。截至今年,国内已公布的(含筹建)的大数据交易所(中心)已超过30个。
利好政策有了,头个吃螃蟹的有了,大数据交易所在国内各地如雨后春笋般铺开,北京、上海、浙江、武汉、黑龙江等。截至今年,国内已公布的(含筹建)的大数据交易所(中心)已超过30个。
俗话说,万事开头难。既然有了良好开头,未来想必一马平川,这或许是贵数所许下“五年万亿”豪言的底气来源。
然而事情并未完全如预期那般顺利,大数据公司的确在野蛮生长,但大数据交易所却逐渐转为不活跃状态—越来越少的人在上面交易。
广州市一家数据第三方公司的从业者告诉南风窗记者,数据需求一般直接定向采购即可,并不特别需要经过交易所。相反,如果轻易把自家的API接口接入平台,平台上的技术方、需求方、中介方都有可能私自下载数据,产生数据泄露和数据滥用的风险。这对不少公司,都是难以承担的损失。
隐私之痛
在大数据交易所中的业务,可简单划分为三大类。
一类是买卖数据。服务商根据需求方要求,利用网络爬虫、众包等合法途径采集相应数据,经整理、校对、打包等处理后出售。
一类是買卖数据结果。根据需求方需求,对数据进行清洗、分析、建模、可视化后,形成处理结果再出售。
这两类是涉及数据交易中最高频次的商业活动,无论是政府还是国企私企,无论是大企业还是小公司,只要业务涉及大数据方面,都会有需求。
还有一类是交易所仅作为中介,平台本身不存储和分析数据,只作为交易渠道。
关于“为何不在交易所进行数据交易”的问题上,根据记者询问一些公司的结果,多数都不约而同地提到了对隐私和安全的顾虑。
今年315晚会上,曝光了智联招聘、前程无忧、猎聘网等由于缺乏管理,大量个人简历遭遇泄露,被倒卖形成黑色产业。此外,某些手机清理APP打着内存清理的幌子,暗中擅自收集包括用户通讯录、定位信息、应用列表等信息,这些都是数据泄露的典型案例。
在网络上,这样的数据买卖早已形成一条成熟的灰色产业链。通过“内鬼—黑客—爬虫软件开发商—清洗方—加工商—料商—买家”的链条,把铲出的数据分门别类,标上不同的价格对外打包出售。 大数据交易平台正是面临这样的问题,交易过程中产生的数据确权、数据回溯、交易过程中的安全性、合法性、隐私性保障等问题,至今尚未得到妥善解决。
“特别是数据确权这一项,由于是多方参与,在现实中很难去严格划分什么情况下什么类型的参与方可以获得数据的权利。”一家大数据服务商的技术总监陆新告诉记者。
2017年,国家通过实施《网络安全法》保障公民与企业的数据安全。网络安全法第四十二条规定,网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。
这是一条有关数据非法买卖的原则性法规,依据此条款,最高法、最高检发布《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,把信息侵权列入刑法惩罚范畴。
各项法规的出台,等于给大数据交易平台的遍地开花浇了一盆冷水,因为上面部分的数据交易面临合法性的问题。
要不得获得用户同意,要不得使个人数据匿名且无法复原。前者需要在交易的时候再次授权,这在海量数据的交易中是不现实的;而后者的“无法复原”,在技术上还很难达到。
规则先行
对于外界的普遍担忧,大部分的交易所其实在官网上给出了回应。
一些交易所是通过建“云”的方式,把数据的存放和处理放在云端。而今年新建的北京国际大数据交易所,则声称“与隐私计算技术结合,主打数据特定使用权流通”。
实际上,之前贵数所也曾发布《数据确权暂行管理办法》,尝试对数据的使用权等进行公开竞价,以实现数据的登记确权及变现。
但陆新指出,传统交易所多采用的明文数据,所有权和使用权是无法真正分离的。如果想分离得用隐私计算,而这种计算量是明文数据计算的十倍以上。
容易产生权属界定不清、要素流转无序、定价机制缺失、安全保护不足等问题,这也是掣肘数据要素高效配置的最大痛点之一。
他认为,使用华控清交多方计算的北数所,或许有别于传统交易所,达成“数据可用不可见,用途可控可计量”的目标。
关于数据交易的难题,实际上已是业界沉疴。
不同于土地、劳动力、资本等生产要素,成本极低、再生性强、难以建立排他性的数据,容易产生权属界定不清、要素流转无序、定价机制缺失、安全保护不足等问题,这也是掣肘数據要素高效配置的最大痛点之一。
对于新技术,法律和政策的制定相对滞后,敢于尝试的人少,生怕走了和贵数所一样的路径。在各地大数据交易所接连折戟的背景下,北数所选择利用新技术继续突破,对于推动停滞的行业再出发有很大意义。
北京之外,广东也在继续探索设立数据交易场所。
2021年7月30日通过,自2021年9月1日起正式施行的《广东省数字经济促进条例》指出,有条件的地区可以依法设立数据交易场所,鼓励和引导数据供需方在数据交易场所进行交易。
此前,深圳在数据交易行为规范立法上走到了前列。7月公布,明年1月1日实施的《深圳经济特区数据条例》在加强个人数据保护的基础上,针对数据要素市场“搭便车”“不劳而获”“大数据杀熟”等竞争乱象进行了明确规定。
在“数字经济”概念火热的当下,加快推进数据价值化、发展数据要素市场是数字经济发展的关键。
但随着数字经济的快速发展,海量数据不断生成、沉淀,在成为新型生产要素的同时,也带来个人隐私被滥用的问题。
一方面是数据价值的深度挖掘,一方面是对于个人隐私安全的保护,这是现阶段的矛盾,也是未来都得完成的课题。