不存在没有价值的数据

来源 :第一财经周刊 | 被引量 : 0次 | 上传用户:xxzzxx_100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读

C=CBNweekly M=Doug Merritt


  企业越发看重对商业数据的分析,开始接受以云、大数据得到分析即服务的模式,但企业面对众多数据时不知道自己想要什么,或者自己想要的能否从海量数据中获得。因为缺乏挖掘数据价值的能力,相当多的数据即便被生产、收集,还是白白浪费掉了。在Splunk总裁兼CEO Doug Merritt看来,如何利用这些数据,从中提取价值,才是企业要关心的问题。

C:数据行业面临最紧要的问题是什么?


  M:一家IT公司有着众多数据,它们来自服务器、防火墙、网络以及移动App等产生的各种机器数据,但它们要么是非结构化的、要么结构化程度非常低。非结构数据的数量在极度膨胀,且种类越来越多,随着IoT物联网的发展,又增加了许多新的来源。这个行业遇到的一个挑战是,需要在海量数据中提取结构以及意义。最被关心的是,如何从数据中获取价值,获取深度分析,获取行动力以及智能。现在有很多数据集,却没有产生价值。很多公司没办法理解海量数据。在全球范围内,用户对于私有云和公有云有着明确区分。75%的数据在自己的防火墙内,是第三方看不见的,其余25%是分享的。大部分人还是不愿意分享他们主要的数据。大家都想把控所有的数据,如何以一种经济上可以承受的方式,建立合理的流程来存储所有数据是另一个挑战。

C:那么如何在海量数据中获得价值呢?


  M:没有意义和价值的数据是不存在的。我们会从别人觉得没有用的垃圾数据中寻找价值。举例来说,很多人认为日志文件(记录在软硬件运行时发生的事件的文件)是一种没有用的数据,倘若我们能从中提取意义,就可以解决很多有意思的问题。比如按日志文件回溯,解决IT运营系统中宕机时间的问题,让IT系统保持稳定和良好的性能。对企业而言,想要成功,需要的不止是平台,而是解决方案。所以我们的出发点要非常窄。譬如解决生产中的问题,就一定要实时地上传数据,这样才能及时作出判断。

C:如何理解你所说的“以一种经济上可以承受的方 式”?


  M:一般来说,就是有效地计算存储数据,以提升存储、处理数据的能力。无论结构化数据还是非结构化数据,随着时间不断增长,其价值也随之改变,因此有热数据、温数据和冷数据之分。热数据对企业非常重要,可以帮助决策、获取洞见,其价值主要是在7天以内,发现安全或生产线上的问题。7天之后,数据会慢慢“冷却”,主要用于分析,不再立即应用在运营上。我们会把变温变冷的数据,转移到下一个数据层级,往后面走的层级,对于性能要求没有那么高,数据存储成本也会更低。也就是说不要贪心,而是要把数据做价值区分,这对所有的行业都适用。

C:商业数据分析会产生无数细分领域的公司,还是有一个包罗万象的巨无霸公司?


  M:会是一个生态系统。遵循这样一个策略,即帮助公司解決具体的问题,提供解决方案,比如个人识别信息,可能有一些公司专门做这样的应用,同时数据平台的扩展性会越来越好,而且使用便利。以我们的平台为例,就已经有1500多个解决方案,对接全球各家公司。

C:在数据挖掘领域,人工智能、深度学习会有哪些作用?


  M:数据领域正在真正走向机器学习、人工智能以及深度学习这3个非常重要的领域。已经有一些可视化的机器学习工具包投入使用,用户通过拖拽、点击就能够完成数据操作。机器学习更是嵌入数据挖掘工具本身,让这些应用可以有更高的有效性。比如,用一款数据安全产品甄别不好的用户行为,就可以通过机器学习来做。可以通过寻找规律来甄别安全威胁是来自于内部,还是来自于外部,这些都可以基于机器学习来完成。(采访:高松)
其他文献
1 引发争议  人们并不热衷用新派数据取代老派经验  2003年,我的《魔球:逆境中的制胜法则》一书出版。该书讲述了奥克兰运动家队在评定棒球运动员身价以及制定棒球比赛策略方面做出的一些新的有益尝试。这支球队缺乏雄厚的资金支持,无法聘请高价球员,因此只能另辟蹊径。通过了解棒球比赛的历史数据和最新数据,借助外部人士对这些数据统计分析,管理层开始频繁出入其他棒球队的管理部门。他们发现了那些被弃用或被忽视
期刊
因為牵涉一起不正当的土地交易,日本首相安倍晋三支持率大跌。  2017年2月,日本森友学园被曝出以超低价格获得一块位于大阪的国有土地用于建造小学校园。这起事件因为安倍晋三的夫人安倍昭惠担任过该小学的名誉校长而受到关注。当时,日本各界质疑政府因安倍夫妇的缘故为森友学园买地办学开“绿灯”。  森友学园丑闻之所以在一年后被重新提及,是因为3月2日《朝日新闻》披露称,日本财务省近畿财务局在“地价门”丑闻中
期刊
仅仅是因为好胜心,以及某种根深蒂固的自尊,WPP全球首席执行官苏铭天否认了这个数据:广告业媒体AdAge统计的2017年TOP15全球数字营销服务提供商排名中,前3名,埃森哲、IBM和德勤,都是传统的咨询公司,而创立于1985年的WPP却不在其中。  这家全球最大的传媒集团的业绩正在经历2009年以来最差的财务状况,由此引发了1999年以来最严重的股价下跌。苏铭天的年终奖预计要缩水3/4。在此前的
期刊
这两周几个巨大经济体的重要领导都在忙着上任和离任。其中最让人没想到的是,美国总统特朗普在Twitter上宣布解除国务卿雷克斯蒂勒森和副国务卿史蒂夫戈德斯坦的职务。之前蒂勒森曾经私下鄙视过现任总统的智商;而特朗普在Twitter上公开回应愿意和蒂勒森比比谁更聪明。但一般认为他们的不可共存性还没达到立刻要分开的地步。  当然,更关键的在于蒂勒森的继任者,中央情报局原局长迈克蓬佩奥。蓬佩奥只有55岁,而
期刊
2018年1月25日,中国科学家孙强及其团队登上了美国生物学杂志《细胞》(Cell)的封面,他们成功克隆出了两只食蟹猴“中中”和“华华”,这也是全球用体细胞克隆灵长类动物的第一例。而今年3月,孙强的团队又公布了“中中”和“华华”的视频,已经3个月大的两个小家伙目前非常健康。  提起克隆动物,就绕不开22年前英国科学家成功克隆出的那只叫“多利”的羊,它也创下了体细胞核移植哺乳动物克隆的先例。  克隆
期刊
CMO比过去更难当了。  全球著名的人力资源公司Spencer Stuar在2016年调查了全球前100位广告客户的CMO任职期限,发现CMO的平均在职时间是42个月,是CXO级别管理者中任职期最短的职位—截至2016年,有一半的CMO的任职期限还不到两年半。  在数字化、技术发展的推动下,CMO正面临着前所未有的复杂市场:各类数字平台分散了消费者的注意力,同时消费者的购买行为脱离了过去的线性模式
期刊
当张阔跟着王小川一起到纽约纳斯达克敲钟时,他已经不是搜狗的人了,而是创业公司互联网中医平台小鹿医馆的创始人。作为搜狗曾经的首席科学家和元老级员工,张阔在搜狗上市前离开,多少有些遗憾。  不过,现在看来,他并没有做错决定。成立不过两年,小鹿医馆平台上已经有超过1万名医生,沉淀了60多万用户,每个月能产生超过3万单问诊。2016年5月,小鹿医馆完成来自晨兴资本和IDG资本的数千万元A轮融资;2017年
期刊
3月20日,乐视网涨停了。此前两天,外界认为可以拯救乐视网的融创董事长孙宏斌辞去了乐视所有相关职务。  很多市场人士认为,唯一能够支撑乐视网涨停的因素是创始人贾跃亭的造车梦有新进展了。3月20日,贾跃亭投资的电动汽车初创企业法拉第未来(Faraday Future)宣布,该公司位于美国加里福尼亚州汉福德(hanford)市的工厂正式开工。公开照片显示,已经有一些工人和机械设备出现在工厂中。3月12
期刊
每年年初的时候,纽约曼哈顿中城的贾维茨会展中心,都会迎来规模庞大的零售行业展会。这原本只是业内人关心的事情,只不过,因为零售业目前正在遭遇的巨变,一些其他行业的人也想到这里探个究竟。  我原本是到这里来见朋友的。她和几个创业者在硅谷创立的公司Citcon,搭上了境外消费的顺风车,两年间攻占了美国很多的机场和商户,让人们直接可以用微信支付和支付宝买单。而在这个会展上,Citcon的广告也耀眼地挂在了
期刊
对多数中国城市来说,商业中心就是城市中心。  这些聚集了城市中最核心商业资源的区域,通常都是城市中人流最密集,也是人群活跃度最高的地方。从某种程度上来说,只要识别出一座城市的商业中心,并能了解到其繁荣程度,就可以对这个城市整体的商业实力和魅力作出大致判断。  为了更好地研究城市的商业发展情况,第一财经·新一线城市研究所将长期收集的城市内品牌门店布局等商业资源数据投射在地图上,运用空间分析算法,建立
期刊