论文部分内容阅读
随着近年来社交媒体发展的日渐繁荣和壮大,挖掘用户的行为习惯和喜好,并对产品和服务进行针对性地调整和优化,让许多企业看到了大数据的商业价值。
有人将2012年比作大数据元年。伴随着大数据时代的来临,让手握大量数据的公司站在了金矿上,有人预测基于数据挖掘将诞生更新、更炫的商业模式。
由IDG-Accel主办的“大数据论坛”于2012年12月6日在北京·文津国际酒店顺利举行,本次论坛由IDG资本创始合伙人熊晓鸽先生、微软全球资深副总裁及亚太研发集团主席张亚勤博士、Accel Partners合伙人吉姆·布莱耶(Jim Breyer)先生担任联席主席。
会议集合了国内大数据生态系统最优秀的技术、商业和学术领袖,同时邀请了来自美国的大数据公司、学者和行业专家,参与交流美国大数据领域的最前沿技术进展。论坛就大数据领域最值得关注的话题,设置了数据平台开放策略和生态、企业如何拥抱大数据、大数据处理和管理技术等五个小组讨论环节,希望通过业内人士的专业解读,可以把握现在,洞悉未来。
IDG资本创始合伙人熊晓鸽在谈到大数据的重要性时把大数据比喻为“梦想的起点”。他说:“在IDG集团的市场研究公司IDC的未来预测中,大数据被定义为未来的第三平台,IDC预测在未来8年的时间,大数据领域将创造21000亿美元的价值。大数据是未来市场的一个非常重要的起点,没有大数据,未来是没法想象的,我们现在谈的各种梦想,大数据便是梦想的起点。”
从投资的角度,熊晓鸽认为大数据可以为投资带来更多的惊喜和想象。他同时表示:“大数据就像是冬天里的寒梅,在投资的冬天里,只有对未来有潜力的技术加以关注,才有可能开出了不起的花来。在上一代的平台里,中国出了一些好公司,但是没有一个以技术为领先的公司,在第三代平台里,中国应该出现更多有突破性技术的大公司。”
中国互联网巨头的数据开放策略和生态
汤道生(腾讯社交网络事业群总裁):腾讯的开放策略主要体现在几个层面,首先在最基础的社交应用上面,其次,是提供处理数据的能力方面。腾讯在过去两年借着开放平台的策略做了很多云平台的服务。腾讯的开放不仅仅体现在帐号的开放,更体现在分享、聊天、云处理,大数据的处理等层面。
张宏江(金山软件CEO):互联网里面跑的最快的公司都是和大数据有关的公司,谷歌、facebook等,这些公司高估值的背后,不仅是本身的运营,更体现在数据价值上面,只是数据的价值还有待更进一步深入挖掘。未来,无论是广告还是对用户的分析和预测上,能把大数据作为未来服务的公司一定是会有更大的价值。
芦义(新浪微博事业部副总经理):大数据最有价值的,一是交易数据,有交易就有传感数据,再有就是社交网络的数据。腾讯给我们带来的压力挺大的,一方面是来自线上web端,另一方面来自微信,其实不仅给新浪微博带来压力也给其他的产品带来了压力。社交网络是有公开传播的和私密分享的两种,这两种网络形态也在融合,比如微信也会做公共服务一样,微博也有部分的私密功能。微博作为中国最重要的一个消息通道,我们会把这个能力建设得更强。
此外,微博还会深入挖掘面向企业的数据,大量的企业账号在上面,这块的市场空白比较大,这么多的粉丝和客户需要跟进和维护,这块的市场我们希望开放部分的数据的方式,向第三方提供更多的机会来服务于企业的市场。
龚世海(大众点评网技术副总裁):大众点评网计划在明年1月份左右正式推出来第一版的数据开放平台,小范围的开放我们在2007、2008年就开始做了,我们都是利用数据点为他们的用户提供各种各样的服务,到今天为止我们有限的开放还是有的,有上百家不同的公司利用点评来为他们的用户提供服务。
企业如何拥抱大数据
车品觉(支付宝首席商业智能官):如果把大数据剖开其实就是数据,我认为就是把传统上还没有用到的比较稳定的数据加一点东西进去。比如说竞争数据,外来的第三方数据等。所谓的大数据就是如何利用别人的数据把整个东西做的更完整一点,把决策做扎实。
黎文宪(SAP全球副总裁):对我们来讲,以前主要的模式是我们卖软件给客户,现在和客户的合作方式变成共同创新。目前来讲速度、硬件、软件似乎都不是问题,我们最大的问题是怎么样把商业价值开发出来,这是我们一个比较大的瓶颈。
尚笠(英特尔中国研究院首席架构师):大数据对于我们是作为一个信息领域首选工具。比如像传统行业,他们面临一些数据,有的大有的小,核心在于,他们并没有相关能力来处理、分析和应用这样的数据。我们的目的就是希望利用大数据作为一个工具,最终希望重新改变传统领域里面的产业链。
陶波(罗克佳华高级副总裁):什么是大数据要看数据在哪里,我个人觉得数据在两个地方,一个是你的生产或经营数据。对于互联网来讲就是你的网站产生的数据,无论是从哪个IP过来的。对于传统行业就是你的自动化控制中所有的设备的参数,或者是楼宇的监测。第二类是管理数据,对于不同的行业来讲一样的,就是你的财务、人力数据,考勤、报销等等,包括人力里面的简历。
周立柱(清华大学计算机系前系主任):大数据这个概念到现在大家也没有一个共同的看法,但是大体上有一个共识,数据量很大,都是解决的实际的问题,这个问题解决起来对我们实际的生产和营业都有益。大数据是一种实验科学,一定要有手段和实验观察。
从另外一个角度讲,我觉得大数据也产生了很多新的领域,孕育了大量的商机,推动我们的社会的进步,比如环境、健康、城市管理问题等,都是和数据搜集的手段和积累有关,都为我们的未来提出了很好的挑战和运用商机的问题。
大数据的处理和管理技术
周涛(百分点首席科学家):同一个用户在不同的媒体和不同的购物网站上的行为,我们需要把它变成同一个,非结构化的数据把它抽象出来。另外我们做的事情就是提供个性化的服务,我们一边做数据,一边想抽出一些知识,我们做数据存储的时候是以唯一的ID做存储架构的,我们通过这样的行为把知识抽出来,不依赖具体的人,这是我们搜集和存储数据的时候比较看中的。 姚宏宇(友友系统CEO):无论是大数据还是云计算,不是简单的解决存储问题,就解决了所有的问题了,很多的成本是网络的IO上发生的,怎么减少这个,存进去之后怎么用,用了之后怎么维护可持续发展。从性能的角度,相当于你花原来的1%的钱可以做一样的事情,甚至更少。
Bob Wiederhold(CouchBase CEO):考虑到存储的话,许多应用的数据量非常大,但是我们对这种应用的本身需要快速的获取数据,能够支持大量的用户群体,广告平台是非常好的例子,以前数据都是你喜欢和不喜欢的方式存储起来,大部分的这样的广告平台现在都是在使用个人用户的信息。因为他们需要把这样的个人信息建立帐户,这点非常重要,这是一个数据发展的方向。
Eva Ho(Factual公司营销及运营副总裁):关于数据的市场,我们看看微软,他们并不是数据生成商,而是来搜集数据,从其他的资源来搜集再卖出去进行营销。与微软不同的是,我们是创造数据的。你可以把数据放在我们的系统上,我们就可以有全球的API,我们的API非常的快速,我们可以通过API搜集数百万的数据再回到我们这里。
移动互联网上的大数据玩法
何云鹏(91无线副总裁):移动互联网从移动通信开始,运营商包括政府和企业都在做相关的研究,我认为更容易的挖掘价值才是大数据,移动互联网的价值在手机上,因为它和人的身份是绑定的且随身携带,其中所蕴含的价值无论是对广告还是其他方面价值都很大。
陈继东(人人游戏首席数据科学家):我们在大数据应用这块主要是两部分,一个是游戏,包括基于数据驱动的游戏的运行和推广,帮助移动和游戏来说如果进行精准的数据的运营,另外是针对移动的精准的投放。
通过大数据一个解决量的问题,一个解决质的问题,更好的从大数据里面挖掘用户的行为数据,得到更精准的营销。特别像用户的使用模式,用户在使用手机玩儿游戏,还是碎片化,这导致的问题就是如何把碎片的行为关联起来,这对数据分析提出了两方面的要求:一个是实时性,另外一个是深入的分析。以后的预测将是这个的发展,一方面深入的分析包括预测的分析,还有复杂的碎片化的时间如果关联起来,跨设备,跨应用。
崔晓波(Talking Data CEO):我们做的是移动应用统计分析平台,我们运营平台会看到和其他普通开发者不太一样的数据,我们看整个平台的,比如用户只在我的平台玩儿了一款游戏,我们认为你只是这个游戏的用户,如果你通过我们的交叉营销,通过营销手段,能够玩其他的更多游戏,我们有所谓的在平台的活跃率,还有一个是生命周期,包括一个产品的生命周期,有一些可能比较短,有一些比较长,我们会站在一定的角度平衡产品的好坏,我们从这个角度来看数据。
数据驱动类应用
胡宁(MediaV CTO):我们是做精准广告的,本身现在的互联网广告的发展已经是非常典型的应用驱动型的大数据的发展,很多时候我们讲的精准广告学,怎么样利用你接触的所有的大数据取得更好的投放,最后的广告都变成了相关的推荐,使得它有一个非常高的转化率,最后做广告变成了一个推荐系统,就变成了精准广告,所以这完全是一个大数据下的典型的应用。
梁信屏(力美广告CTO):如何运用大数据我认为主要分三点:第一是数据那么多,怎么让广告主在我们的平台投放广告,或者从用户的互动,媒体的广告出现或者第三方的数据来的时候怎么样了解这些数据。
其次就是要学会洞察数据。要学会分析用户在系统里面有什么新的行为特征,然后进行相应调整。最后通过对数据的分析数据,可以调整你的匹配模式,这就是真的影响到你的业务调整方向的具体措施。
Derrick Harris(GigaOM云计算资深撰稿人):在美国很多的公司,他们无论数据科学家多好,他们就是无法获得所有想要的数据,他们知道如何来连接,如何来做,如何处理,如何搜索,但是中间还是有一个差距。现在有些人在进行数据的交易,数据成为另一种形式的货币了,这样公司可以付钱给你获取线下的数据,公司作为消费者付钱购买有价值的数据,这是一个可能的趋势。
有人将2012年比作大数据元年。伴随着大数据时代的来临,让手握大量数据的公司站在了金矿上,有人预测基于数据挖掘将诞生更新、更炫的商业模式。
由IDG-Accel主办的“大数据论坛”于2012年12月6日在北京·文津国际酒店顺利举行,本次论坛由IDG资本创始合伙人熊晓鸽先生、微软全球资深副总裁及亚太研发集团主席张亚勤博士、Accel Partners合伙人吉姆·布莱耶(Jim Breyer)先生担任联席主席。
会议集合了国内大数据生态系统最优秀的技术、商业和学术领袖,同时邀请了来自美国的大数据公司、学者和行业专家,参与交流美国大数据领域的最前沿技术进展。论坛就大数据领域最值得关注的话题,设置了数据平台开放策略和生态、企业如何拥抱大数据、大数据处理和管理技术等五个小组讨论环节,希望通过业内人士的专业解读,可以把握现在,洞悉未来。
IDG资本创始合伙人熊晓鸽在谈到大数据的重要性时把大数据比喻为“梦想的起点”。他说:“在IDG集团的市场研究公司IDC的未来预测中,大数据被定义为未来的第三平台,IDC预测在未来8年的时间,大数据领域将创造21000亿美元的价值。大数据是未来市场的一个非常重要的起点,没有大数据,未来是没法想象的,我们现在谈的各种梦想,大数据便是梦想的起点。”
从投资的角度,熊晓鸽认为大数据可以为投资带来更多的惊喜和想象。他同时表示:“大数据就像是冬天里的寒梅,在投资的冬天里,只有对未来有潜力的技术加以关注,才有可能开出了不起的花来。在上一代的平台里,中国出了一些好公司,但是没有一个以技术为领先的公司,在第三代平台里,中国应该出现更多有突破性技术的大公司。”
中国互联网巨头的数据开放策略和生态
汤道生(腾讯社交网络事业群总裁):腾讯的开放策略主要体现在几个层面,首先在最基础的社交应用上面,其次,是提供处理数据的能力方面。腾讯在过去两年借着开放平台的策略做了很多云平台的服务。腾讯的开放不仅仅体现在帐号的开放,更体现在分享、聊天、云处理,大数据的处理等层面。
张宏江(金山软件CEO):互联网里面跑的最快的公司都是和大数据有关的公司,谷歌、facebook等,这些公司高估值的背后,不仅是本身的运营,更体现在数据价值上面,只是数据的价值还有待更进一步深入挖掘。未来,无论是广告还是对用户的分析和预测上,能把大数据作为未来服务的公司一定是会有更大的价值。
芦义(新浪微博事业部副总经理):大数据最有价值的,一是交易数据,有交易就有传感数据,再有就是社交网络的数据。腾讯给我们带来的压力挺大的,一方面是来自线上web端,另一方面来自微信,其实不仅给新浪微博带来压力也给其他的产品带来了压力。社交网络是有公开传播的和私密分享的两种,这两种网络形态也在融合,比如微信也会做公共服务一样,微博也有部分的私密功能。微博作为中国最重要的一个消息通道,我们会把这个能力建设得更强。
此外,微博还会深入挖掘面向企业的数据,大量的企业账号在上面,这块的市场空白比较大,这么多的粉丝和客户需要跟进和维护,这块的市场我们希望开放部分的数据的方式,向第三方提供更多的机会来服务于企业的市场。
龚世海(大众点评网技术副总裁):大众点评网计划在明年1月份左右正式推出来第一版的数据开放平台,小范围的开放我们在2007、2008年就开始做了,我们都是利用数据点为他们的用户提供各种各样的服务,到今天为止我们有限的开放还是有的,有上百家不同的公司利用点评来为他们的用户提供服务。
企业如何拥抱大数据
车品觉(支付宝首席商业智能官):如果把大数据剖开其实就是数据,我认为就是把传统上还没有用到的比较稳定的数据加一点东西进去。比如说竞争数据,外来的第三方数据等。所谓的大数据就是如何利用别人的数据把整个东西做的更完整一点,把决策做扎实。
黎文宪(SAP全球副总裁):对我们来讲,以前主要的模式是我们卖软件给客户,现在和客户的合作方式变成共同创新。目前来讲速度、硬件、软件似乎都不是问题,我们最大的问题是怎么样把商业价值开发出来,这是我们一个比较大的瓶颈。
尚笠(英特尔中国研究院首席架构师):大数据对于我们是作为一个信息领域首选工具。比如像传统行业,他们面临一些数据,有的大有的小,核心在于,他们并没有相关能力来处理、分析和应用这样的数据。我们的目的就是希望利用大数据作为一个工具,最终希望重新改变传统领域里面的产业链。
陶波(罗克佳华高级副总裁):什么是大数据要看数据在哪里,我个人觉得数据在两个地方,一个是你的生产或经营数据。对于互联网来讲就是你的网站产生的数据,无论是从哪个IP过来的。对于传统行业就是你的自动化控制中所有的设备的参数,或者是楼宇的监测。第二类是管理数据,对于不同的行业来讲一样的,就是你的财务、人力数据,考勤、报销等等,包括人力里面的简历。
周立柱(清华大学计算机系前系主任):大数据这个概念到现在大家也没有一个共同的看法,但是大体上有一个共识,数据量很大,都是解决的实际的问题,这个问题解决起来对我们实际的生产和营业都有益。大数据是一种实验科学,一定要有手段和实验观察。
从另外一个角度讲,我觉得大数据也产生了很多新的领域,孕育了大量的商机,推动我们的社会的进步,比如环境、健康、城市管理问题等,都是和数据搜集的手段和积累有关,都为我们的未来提出了很好的挑战和运用商机的问题。
大数据的处理和管理技术
周涛(百分点首席科学家):同一个用户在不同的媒体和不同的购物网站上的行为,我们需要把它变成同一个,非结构化的数据把它抽象出来。另外我们做的事情就是提供个性化的服务,我们一边做数据,一边想抽出一些知识,我们做数据存储的时候是以唯一的ID做存储架构的,我们通过这样的行为把知识抽出来,不依赖具体的人,这是我们搜集和存储数据的时候比较看中的。 姚宏宇(友友系统CEO):无论是大数据还是云计算,不是简单的解决存储问题,就解决了所有的问题了,很多的成本是网络的IO上发生的,怎么减少这个,存进去之后怎么用,用了之后怎么维护可持续发展。从性能的角度,相当于你花原来的1%的钱可以做一样的事情,甚至更少。
Bob Wiederhold(CouchBase CEO):考虑到存储的话,许多应用的数据量非常大,但是我们对这种应用的本身需要快速的获取数据,能够支持大量的用户群体,广告平台是非常好的例子,以前数据都是你喜欢和不喜欢的方式存储起来,大部分的这样的广告平台现在都是在使用个人用户的信息。因为他们需要把这样的个人信息建立帐户,这点非常重要,这是一个数据发展的方向。
Eva Ho(Factual公司营销及运营副总裁):关于数据的市场,我们看看微软,他们并不是数据生成商,而是来搜集数据,从其他的资源来搜集再卖出去进行营销。与微软不同的是,我们是创造数据的。你可以把数据放在我们的系统上,我们就可以有全球的API,我们的API非常的快速,我们可以通过API搜集数百万的数据再回到我们这里。
移动互联网上的大数据玩法
何云鹏(91无线副总裁):移动互联网从移动通信开始,运营商包括政府和企业都在做相关的研究,我认为更容易的挖掘价值才是大数据,移动互联网的价值在手机上,因为它和人的身份是绑定的且随身携带,其中所蕴含的价值无论是对广告还是其他方面价值都很大。
陈继东(人人游戏首席数据科学家):我们在大数据应用这块主要是两部分,一个是游戏,包括基于数据驱动的游戏的运行和推广,帮助移动和游戏来说如果进行精准的数据的运营,另外是针对移动的精准的投放。
通过大数据一个解决量的问题,一个解决质的问题,更好的从大数据里面挖掘用户的行为数据,得到更精准的营销。特别像用户的使用模式,用户在使用手机玩儿游戏,还是碎片化,这导致的问题就是如何把碎片的行为关联起来,这对数据分析提出了两方面的要求:一个是实时性,另外一个是深入的分析。以后的预测将是这个的发展,一方面深入的分析包括预测的分析,还有复杂的碎片化的时间如果关联起来,跨设备,跨应用。
崔晓波(Talking Data CEO):我们做的是移动应用统计分析平台,我们运营平台会看到和其他普通开发者不太一样的数据,我们看整个平台的,比如用户只在我的平台玩儿了一款游戏,我们认为你只是这个游戏的用户,如果你通过我们的交叉营销,通过营销手段,能够玩其他的更多游戏,我们有所谓的在平台的活跃率,还有一个是生命周期,包括一个产品的生命周期,有一些可能比较短,有一些比较长,我们会站在一定的角度平衡产品的好坏,我们从这个角度来看数据。
数据驱动类应用
胡宁(MediaV CTO):我们是做精准广告的,本身现在的互联网广告的发展已经是非常典型的应用驱动型的大数据的发展,很多时候我们讲的精准广告学,怎么样利用你接触的所有的大数据取得更好的投放,最后的广告都变成了相关的推荐,使得它有一个非常高的转化率,最后做广告变成了一个推荐系统,就变成了精准广告,所以这完全是一个大数据下的典型的应用。
梁信屏(力美广告CTO):如何运用大数据我认为主要分三点:第一是数据那么多,怎么让广告主在我们的平台投放广告,或者从用户的互动,媒体的广告出现或者第三方的数据来的时候怎么样了解这些数据。
其次就是要学会洞察数据。要学会分析用户在系统里面有什么新的行为特征,然后进行相应调整。最后通过对数据的分析数据,可以调整你的匹配模式,这就是真的影响到你的业务调整方向的具体措施。
Derrick Harris(GigaOM云计算资深撰稿人):在美国很多的公司,他们无论数据科学家多好,他们就是无法获得所有想要的数据,他们知道如何来连接,如何来做,如何处理,如何搜索,但是中间还是有一个差距。现在有些人在进行数据的交易,数据成为另一种形式的货币了,这样公司可以付钱给你获取线下的数据,公司作为消费者付钱购买有价值的数据,这是一个可能的趋势。