论文部分内容阅读
征信,这个敏感而核心的行业,尚未规范,便沦为各方夺利的草莽江湖。
“君子之言,信而有征。”
征信,指可验证其言为实,或征求、验证信用。这个源于《左传·昭公八年》的词,在2 500多年后的今天,成为一个行业,一个奠定许多行业基础的行业。
自2013年初具雏形,征信行业便渐成各方夺利的草莽江湖。乱象比如——
靠盗取企业信用数据,一个黑客年收入过千万元;从黑市上购买数据起家的大数据公司,估值几十亿元;急于变现的征信公司,各地招聘代理,推销征信报告,年流水上亿元;甚至出现了备案交易的“中间人”,公开叫卖征信公司备案……
这个敏感而核心的行业,正在经历它的野蛮时代。
数据黑链
黑客KK又接了一单生意,盗取某工商信息查询企业的数据。该企业的核心数据服务器放在云端,这意味着想要入侵的人,将不得不对抗整个云端安全系统。
不过KK自有奇招,“能走后门,绝不走正门”。
月黑风高,最宜作案。KK披上他的黑色战衣,收好电脑,躲在该企业楼下的树丛里。人去楼空后,他掏出电脑,利用小工具强行破解公司Wi-Fi,进入内网,盗取云端服务器的用户名和密码,入侵数据库,拖出200万条公司缓存数据。
出手数据,几万元落袋为安。
过去,一个月也未必能开张,现在隔几天干一单,月收入过百万元。近两年业务量的猛增,黑客KK头头是道地分析称,这和征信行业风口有关。
虽然早在1988年,国内首家专业信用评级机构就已成立,但由于政府数据迟迟未公开,征信行业发展缓慢。直到2013年,《征信业管理条例》颁布,给民间征信机构画出了跑道——对于企业征信,采取备案制;对于个人征信,采取牌照制。
目前,已有138家企业征信机构备案通过,而另外8家个人征信机构,正等待牌照下发。然而,这样的速度并不能满足市场的需求。于是,局外玩家拥入赛道,大数据公司和金融公司风控部门,成了征信公司外最大的两股势力。
征信行业呈三足鼎立之势。而数据,正是它们跑马圈地的利器。这些数据价格不菲。比如从车管所调取一个人的数据,价格是2~3元;从银联调取数据,一个人是1~2元。而在黑市上,这些数据只需1角左右。对数据的渴求和利益的诱惑,造就了黑市繁华。
像KK这样的黑客,构成了数据黑市的源头。他们盗取数据的对象通常有两个——
一是政府的数据代理商。有数据的政府部门,通常会下设一两家代理商,供需要数据的企业申请接口。每次从接口调取数据留下的缓存,就是黑客的目标。
二是信用信息查询企业。在来源方面,这类企业往往通过和金融机构合作,或通过从互联网抓取,获取数据。
国内靠盗取数据为生的黑客并不多,大概几千人。黑市上另一部分数据,源自内鬼。根据“行规”,无论黑客还是内鬼,都不会直接把数据卖给征信机构,而是倒卖给黑市中的重要角色——中间商,一个数十万人的庞大群体。
周晓青正是其中一员。最近,一个客户找到周晓青,要求购买车管所的数据:出价35万元,买400万条。周晓青通过合作的黑客军团,很快搞到了数据。除了车牌号码、所有人等基本信息外,连发动机号、车辆识别号、保险到期时间都有。
在黑市中,工商、身份信息、车辆、房产、银行等几类数据最吃香,它们也是征信行业必备的底层数据。为了规避风险,购买一些敏感数据时,周晓青就通过一家皮包公司走账。
后来上述客户多次光顾,购买工商、房产等信息。打了几次交道后,周晓青才知道,这是一家大数据公司,而且凭借黑市数据起家,目前估值几十亿元。
不过,这也没什么稀奇。这两年,周晓青接触到的客户,不论数据公司、金融公司还是征信公司,估值比这个高的多了去,“万亿级别地下黑市,早已形成”。
征信四难
黑市之外,数据源污染、数据处理技术落后、数据模型验证难、数据同质化,同样损害着这个新兴行业。
“黑市数据真假难辨,因为大家都是掺杂卖”,周晓青甚至自己都干过这种事。他把一份只有100万条的银行VIP客户数据,足足填充了900万条假数据再卖出去。
银行将活期余额超过800万元的用户,称为七星级用户;超过1 000万元的,称为八星级用户。“填充的也是银行客户数据,只是级别很低,冒充成高星级用户。但购买数据的公司,很难鉴别真伪”。就这样,一份黑市价值3万元的数据,经过填充后,周晓青卖了20万元。当然,购买者一般事前会要求抽样检测,但数据一次销售,少则几万条,多则上亿条,不可能完全鉴别真伪。
除了接“盗数据”的活,周晓青也接“放数据”的活。
曾有一家保险公司,将一部分篡改后的数据放出,“故意将一些骗保的人,加入高净值用户名单,以搅乱市场上其他竞争对手的视线”。周晓青的任务,就是把这部分数据销售给其他保险公司。为了推广这些假数据,客户甚至愿意出比买数据还高的价钱,“商业战场上,人们似乎总喜欢花更多的钱,去损人不利己”。
这些流窜在黑市中“被污染的数据”,成了征信行业最大的隐患。连底层数据都是假的,在这个基础上建立的“征信模型”或“风控模型”,又如何可信呢?
况且,不是所有数据都能点石成金,征信公司首先需要沙中淘金。
比如,一家互联网金融平台提供给征信公司的《个人征信报告》中,除了基本信息外,还包括公司法人、诉讼信息、各大电商是否购物等几个维度。这样一堆原始数据,需要经过清洗、挖掘、建模分析,才可以使用。但当下绝大多数征信公司,充其量只是数据集合地,毫无数据处理能力。
因此,他们也只能提供简单的数据包,无法根据客户的个性化需求,提供更复杂的征信产品。
而要打磨一个好的征信模型,光有数据处理能力也不够,还需要模型发生作用的时间来验证。 验证一个征信模型,至少要有5~10年的产品观察周期。比如,房贷的周期是30年,车贷5年,没有跑完整个借贷周期,就不能判断这个模型的准确性。验证之后,还需要持续地对模型进行修正、重复验证,以实现模型的迭代优化。这是一个漫长过程,从这个维度讲,才起步不久的中国征信行业,很难有完美的征信模型。
数据同质化更是征信行业发展缓慢的掣肘。目前,市面上只有三个数据库比较有价值:一个是支付宝的芝麻信用分,来源于用户的淘宝交易记录和行为数据;一个是腾讯,来自社交数据;最后一个是前海征信,拥有平安集团的数据。除此之外,大部分征信机构手里的数据大体雷同,以致大家陷入低价竞争的恶性循环。
“曲线救国”
既然很难靠有价值的征信产品获利,大家纷纷“曲线救国”。
专做企业征信的绿盾征信,其模式就备受诟病。他们在全国招代理人,帮他们推销征信报告。绿盾征信员工小王透露,目前绿盾已在全国发展了800多位代理,分成方式是“二八”,代理商拿大头,可获得80%的佣金提成。
小王称,要成为绿盾的市级代理,需要一次性缴费50万元,县级代理则是20万元。而绿盾对县市级别代理人的唯一要求就是:在当地有人脉。“企业资源、政府资源很重要,有企业资源,就可以直接销售,而拥有政府资源,就可以指定要这家的征信报告。这才值得合作”。
“一年就回本了”,小王表示一般市级代理一年能卖出几十万元的流水。如果按照800家代理,平均每个人缴纳30万元代理费,绿盾征信已获利2亿元以上。而平均每个代理商销售20万元的话,每年的流水也上亿元。
绿盾所谓的征信报告,主要是6个维度:工商、行业、金融借贷、媒体、企业运营、市场反馈。售价倒不贵,针注册资本小于等于500万元的企业,800元一次;大于500万元的,1 800元一次。“但这个报告只针对单次,比如某次的企业合作、政府招投标等,换句话说,一家企业一年可能需要几十份征信报告。”
然而这样的报告,到底有多少价值?小王透露,这些报告信息,其实都可以从网上查询到,无非是政府公开信息的汇总。
除了“代理商模式”,绿盾还有一条业务线,利用“备案”资质套利,即帮助一些“污点”企业背书、洗白。举例来说,一家被处罚多年的制药企业,一度成为绿盾征信示范企业,不仅颁发优秀企业榜样牌匾,还成为绿盾官网的“信用楷模”。
除了上述两种变现模式,征信企业还衍生了一种隐秘的变现方式——卖备案资质。
目前,专门做这种备案交易的“中间人”已经出现。他们的服务范围包括,帮助企业申请备案,也能帮助收购已有备案资质的公司。报价是——北京地区征信牌照在100万元以上,其他地区在80万元左右。
手续费已到如此价位,备案的价格将何其高?目前,支付牌照市面的售价已高达6亿元。有业内人士担忧,征信备案和牌照会重复第三方支付牌照的疯狂。
事实上,今年央行已放慢了企业征信备案的审批速度。作为金融核心的征信、风控,乃是众行业的基础砖瓦,早已容不下一丝浮躁。
“君子之言,信而有征。”
征信,指可验证其言为实,或征求、验证信用。这个源于《左传·昭公八年》的词,在2 500多年后的今天,成为一个行业,一个奠定许多行业基础的行业。
自2013年初具雏形,征信行业便渐成各方夺利的草莽江湖。乱象比如——
靠盗取企业信用数据,一个黑客年收入过千万元;从黑市上购买数据起家的大数据公司,估值几十亿元;急于变现的征信公司,各地招聘代理,推销征信报告,年流水上亿元;甚至出现了备案交易的“中间人”,公开叫卖征信公司备案……
这个敏感而核心的行业,正在经历它的野蛮时代。
数据黑链
黑客KK又接了一单生意,盗取某工商信息查询企业的数据。该企业的核心数据服务器放在云端,这意味着想要入侵的人,将不得不对抗整个云端安全系统。
不过KK自有奇招,“能走后门,绝不走正门”。
月黑风高,最宜作案。KK披上他的黑色战衣,收好电脑,躲在该企业楼下的树丛里。人去楼空后,他掏出电脑,利用小工具强行破解公司Wi-Fi,进入内网,盗取云端服务器的用户名和密码,入侵数据库,拖出200万条公司缓存数据。
出手数据,几万元落袋为安。
过去,一个月也未必能开张,现在隔几天干一单,月收入过百万元。近两年业务量的猛增,黑客KK头头是道地分析称,这和征信行业风口有关。
虽然早在1988年,国内首家专业信用评级机构就已成立,但由于政府数据迟迟未公开,征信行业发展缓慢。直到2013年,《征信业管理条例》颁布,给民间征信机构画出了跑道——对于企业征信,采取备案制;对于个人征信,采取牌照制。
目前,已有138家企业征信机构备案通过,而另外8家个人征信机构,正等待牌照下发。然而,这样的速度并不能满足市场的需求。于是,局外玩家拥入赛道,大数据公司和金融公司风控部门,成了征信公司外最大的两股势力。
征信行业呈三足鼎立之势。而数据,正是它们跑马圈地的利器。这些数据价格不菲。比如从车管所调取一个人的数据,价格是2~3元;从银联调取数据,一个人是1~2元。而在黑市上,这些数据只需1角左右。对数据的渴求和利益的诱惑,造就了黑市繁华。
像KK这样的黑客,构成了数据黑市的源头。他们盗取数据的对象通常有两个——
一是政府的数据代理商。有数据的政府部门,通常会下设一两家代理商,供需要数据的企业申请接口。每次从接口调取数据留下的缓存,就是黑客的目标。
二是信用信息查询企业。在来源方面,这类企业往往通过和金融机构合作,或通过从互联网抓取,获取数据。
国内靠盗取数据为生的黑客并不多,大概几千人。黑市上另一部分数据,源自内鬼。根据“行规”,无论黑客还是内鬼,都不会直接把数据卖给征信机构,而是倒卖给黑市中的重要角色——中间商,一个数十万人的庞大群体。
周晓青正是其中一员。最近,一个客户找到周晓青,要求购买车管所的数据:出价35万元,买400万条。周晓青通过合作的黑客军团,很快搞到了数据。除了车牌号码、所有人等基本信息外,连发动机号、车辆识别号、保险到期时间都有。
在黑市中,工商、身份信息、车辆、房产、银行等几类数据最吃香,它们也是征信行业必备的底层数据。为了规避风险,购买一些敏感数据时,周晓青就通过一家皮包公司走账。
后来上述客户多次光顾,购买工商、房产等信息。打了几次交道后,周晓青才知道,这是一家大数据公司,而且凭借黑市数据起家,目前估值几十亿元。
不过,这也没什么稀奇。这两年,周晓青接触到的客户,不论数据公司、金融公司还是征信公司,估值比这个高的多了去,“万亿级别地下黑市,早已形成”。
征信四难
黑市之外,数据源污染、数据处理技术落后、数据模型验证难、数据同质化,同样损害着这个新兴行业。
“黑市数据真假难辨,因为大家都是掺杂卖”,周晓青甚至自己都干过这种事。他把一份只有100万条的银行VIP客户数据,足足填充了900万条假数据再卖出去。
银行将活期余额超过800万元的用户,称为七星级用户;超过1 000万元的,称为八星级用户。“填充的也是银行客户数据,只是级别很低,冒充成高星级用户。但购买数据的公司,很难鉴别真伪”。就这样,一份黑市价值3万元的数据,经过填充后,周晓青卖了20万元。当然,购买者一般事前会要求抽样检测,但数据一次销售,少则几万条,多则上亿条,不可能完全鉴别真伪。
除了接“盗数据”的活,周晓青也接“放数据”的活。
曾有一家保险公司,将一部分篡改后的数据放出,“故意将一些骗保的人,加入高净值用户名单,以搅乱市场上其他竞争对手的视线”。周晓青的任务,就是把这部分数据销售给其他保险公司。为了推广这些假数据,客户甚至愿意出比买数据还高的价钱,“商业战场上,人们似乎总喜欢花更多的钱,去损人不利己”。
这些流窜在黑市中“被污染的数据”,成了征信行业最大的隐患。连底层数据都是假的,在这个基础上建立的“征信模型”或“风控模型”,又如何可信呢?
况且,不是所有数据都能点石成金,征信公司首先需要沙中淘金。
比如,一家互联网金融平台提供给征信公司的《个人征信报告》中,除了基本信息外,还包括公司法人、诉讼信息、各大电商是否购物等几个维度。这样一堆原始数据,需要经过清洗、挖掘、建模分析,才可以使用。但当下绝大多数征信公司,充其量只是数据集合地,毫无数据处理能力。
因此,他们也只能提供简单的数据包,无法根据客户的个性化需求,提供更复杂的征信产品。
而要打磨一个好的征信模型,光有数据处理能力也不够,还需要模型发生作用的时间来验证。 验证一个征信模型,至少要有5~10年的产品观察周期。比如,房贷的周期是30年,车贷5年,没有跑完整个借贷周期,就不能判断这个模型的准确性。验证之后,还需要持续地对模型进行修正、重复验证,以实现模型的迭代优化。这是一个漫长过程,从这个维度讲,才起步不久的中国征信行业,很难有完美的征信模型。
数据同质化更是征信行业发展缓慢的掣肘。目前,市面上只有三个数据库比较有价值:一个是支付宝的芝麻信用分,来源于用户的淘宝交易记录和行为数据;一个是腾讯,来自社交数据;最后一个是前海征信,拥有平安集团的数据。除此之外,大部分征信机构手里的数据大体雷同,以致大家陷入低价竞争的恶性循环。
“曲线救国”
既然很难靠有价值的征信产品获利,大家纷纷“曲线救国”。
专做企业征信的绿盾征信,其模式就备受诟病。他们在全国招代理人,帮他们推销征信报告。绿盾征信员工小王透露,目前绿盾已在全国发展了800多位代理,分成方式是“二八”,代理商拿大头,可获得80%的佣金提成。
小王称,要成为绿盾的市级代理,需要一次性缴费50万元,县级代理则是20万元。而绿盾对县市级别代理人的唯一要求就是:在当地有人脉。“企业资源、政府资源很重要,有企业资源,就可以直接销售,而拥有政府资源,就可以指定要这家的征信报告。这才值得合作”。
“一年就回本了”,小王表示一般市级代理一年能卖出几十万元的流水。如果按照800家代理,平均每个人缴纳30万元代理费,绿盾征信已获利2亿元以上。而平均每个代理商销售20万元的话,每年的流水也上亿元。
绿盾所谓的征信报告,主要是6个维度:工商、行业、金融借贷、媒体、企业运营、市场反馈。售价倒不贵,针注册资本小于等于500万元的企业,800元一次;大于500万元的,1 800元一次。“但这个报告只针对单次,比如某次的企业合作、政府招投标等,换句话说,一家企业一年可能需要几十份征信报告。”
然而这样的报告,到底有多少价值?小王透露,这些报告信息,其实都可以从网上查询到,无非是政府公开信息的汇总。
除了“代理商模式”,绿盾还有一条业务线,利用“备案”资质套利,即帮助一些“污点”企业背书、洗白。举例来说,一家被处罚多年的制药企业,一度成为绿盾征信示范企业,不仅颁发优秀企业榜样牌匾,还成为绿盾官网的“信用楷模”。
除了上述两种变现模式,征信企业还衍生了一种隐秘的变现方式——卖备案资质。
目前,专门做这种备案交易的“中间人”已经出现。他们的服务范围包括,帮助企业申请备案,也能帮助收购已有备案资质的公司。报价是——北京地区征信牌照在100万元以上,其他地区在80万元左右。
手续费已到如此价位,备案的价格将何其高?目前,支付牌照市面的售价已高达6亿元。有业内人士担忧,征信备案和牌照会重复第三方支付牌照的疯狂。
事实上,今年央行已放慢了企业征信备案的审批速度。作为金融核心的征信、风控,乃是众行业的基础砖瓦,早已容不下一丝浮躁。