论文部分内容阅读
大数据时代,视野可以更广阔,请不要错过它
谷歌、亚马逊、Facebook,这些称霸全球互联网的企业成功的共同要素是什么?是商业模式的创新还是技术的领先?或许都有,但成功的共同要素是大数据以及基于大数据的数据分析能力。作为最近两年的高出镜率词汇,什么是大数据呢?
舍恩伯格在《大数据时代》中对大数据的定义简洁而清晰:所谓大数据就是大量的数据。那么,究竟多少数据才称得上“大量”呢?日本野村综合研究所的分析师城田真琴在《大数据的冲击》一书中对大数据的表述是:用现有的一般技术难以管理的大量数据的集合。可见,当数据量达到“现有一般技术难以管理”时,它们就足够“大”了。所谓“用现有的一般技术难以管理”,举例来说,就是用目前在企业数据库占主流地位的关系型数据库无法进行管理、具有复杂结构的数据。
更确切地说,几帕字节(10^15)到几埃字节(10^18)的数据量才可谓“大”。当然,从多样性的角度来说,除了传统的销售、库存数据,现在企业所采集和分析的数据还包括网站的日志数据、呼叫中心通话记录、微博等社交媒体中的文本数据、智能手机内置GPS所产生的位置信息,甚至还有图片和视频。另外,数据产生和更新的频率,也是衡量大数据的一个重要特征。例如,日本全国公路上安装的交通堵塞探测器和路面状况传感器每时每刻都在产生着庞大的数据,波音客机的引擎每秒也产生数个GB的数据。
大数据最大的用途之一是预测。大家都对航班晚点痛苦不已,怎么才能提前知道我订的航班是否会晚点呢?FlightCaster网站可以让你提前知道航班的晚点概率。这家美国公司的预报是基于交通统计局、联邦航空局交通管制中心警报、美国气象局和FlightStats(一个航班运行状况信息的网站)的数据而发布的。FlightCaster能在航空公司正式发布晚点信息前6小时告诉你,你乘坐的航班“正点概率只有3%,轻微晚点概率14%,晚点一个钟头以上的概率是83%”。这家网站所采用的是过去十年上述单位保存的庞大统计数据,通过人工智能分析,得出准确率高达90%的预测。至于过去十年数据和未来某次航班是否晚点之间有何因果关系,暂时并不能解释清楚——这便是大数据的另外一个特征:用相关关系取代因果关系。
对个人用户而言,大数据还可以预测机票价格走势,为自费旅游者省钱;预测交通拥堵情况,帮助人们选择更好的时段和路线节省出行时间;也可以像亚马逊那样,为你提供更准确的书单,帮你发现更多好书。谷歌还通过分析用户的搜索關键词,预测出了2009年禽流感在美国本土的严重程度以及未来的流行趋势,成功帮助卫生部门抑制住了疾病的大规模爆发。
现代商业环境变化十分剧烈,对于企业,在大数据时代做好准备,利用好大数据尤为重要。如著名文具制造商万宝龙,通过分析监控摄像机的数据,将最想卖出去的商品摆到最容易吸引顾客目光的位置,使得销售量提高了20%。
通过运用过去无法获取的数据来催生新的服务,这才是人们对未来大数据时代的最大期望。
谷歌、亚马逊、Facebook,这些称霸全球互联网的企业成功的共同要素是什么?是商业模式的创新还是技术的领先?或许都有,但成功的共同要素是大数据以及基于大数据的数据分析能力。作为最近两年的高出镜率词汇,什么是大数据呢?
舍恩伯格在《大数据时代》中对大数据的定义简洁而清晰:所谓大数据就是大量的数据。那么,究竟多少数据才称得上“大量”呢?日本野村综合研究所的分析师城田真琴在《大数据的冲击》一书中对大数据的表述是:用现有的一般技术难以管理的大量数据的集合。可见,当数据量达到“现有一般技术难以管理”时,它们就足够“大”了。所谓“用现有的一般技术难以管理”,举例来说,就是用目前在企业数据库占主流地位的关系型数据库无法进行管理、具有复杂结构的数据。
更确切地说,几帕字节(10^15)到几埃字节(10^18)的数据量才可谓“大”。当然,从多样性的角度来说,除了传统的销售、库存数据,现在企业所采集和分析的数据还包括网站的日志数据、呼叫中心通话记录、微博等社交媒体中的文本数据、智能手机内置GPS所产生的位置信息,甚至还有图片和视频。另外,数据产生和更新的频率,也是衡量大数据的一个重要特征。例如,日本全国公路上安装的交通堵塞探测器和路面状况传感器每时每刻都在产生着庞大的数据,波音客机的引擎每秒也产生数个GB的数据。
大数据最大的用途之一是预测。大家都对航班晚点痛苦不已,怎么才能提前知道我订的航班是否会晚点呢?FlightCaster网站可以让你提前知道航班的晚点概率。这家美国公司的预报是基于交通统计局、联邦航空局交通管制中心警报、美国气象局和FlightStats(一个航班运行状况信息的网站)的数据而发布的。FlightCaster能在航空公司正式发布晚点信息前6小时告诉你,你乘坐的航班“正点概率只有3%,轻微晚点概率14%,晚点一个钟头以上的概率是83%”。这家网站所采用的是过去十年上述单位保存的庞大统计数据,通过人工智能分析,得出准确率高达90%的预测。至于过去十年数据和未来某次航班是否晚点之间有何因果关系,暂时并不能解释清楚——这便是大数据的另外一个特征:用相关关系取代因果关系。
对个人用户而言,大数据还可以预测机票价格走势,为自费旅游者省钱;预测交通拥堵情况,帮助人们选择更好的时段和路线节省出行时间;也可以像亚马逊那样,为你提供更准确的书单,帮你发现更多好书。谷歌还通过分析用户的搜索關键词,预测出了2009年禽流感在美国本土的严重程度以及未来的流行趋势,成功帮助卫生部门抑制住了疾病的大规模爆发。
现代商业环境变化十分剧烈,对于企业,在大数据时代做好准备,利用好大数据尤为重要。如著名文具制造商万宝龙,通过分析监控摄像机的数据,将最想卖出去的商品摆到最容易吸引顾客目光的位置,使得销售量提高了20%。
通过运用过去无法获取的数据来催生新的服务,这才是人们对未来大数据时代的最大期望。