解码数据科学家

来源 :商业价值 | 被引量 : 0次 | 上传用户:jonasen128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据科学家是一个好奇的,不断质疑现有假设,能盯着数据就能指出趋势的人。

  21世纪最性感的职业,你觉得是什么?美国媒体认为,是数据科学家,因为这个职位听起来充满诱惑却又不被大众所了解。在知名招聘网站INDEED上,数据科学家的需求百分比在短短一年之内由0增长到现在的近0.02%;到2018年,在美国将会有49万名数据科学家的需求,职位空缺达19万;中国的诸多互联网公司如阿里巴巴等也相继贴出了高薪聘请数据科学家的Offer……
  那么,数据科学家,到底是做什么的呢?
  数据科学家这个职位来源于Jonathan Goldman。他在2006年的6月份进入商务社交网站LinkedIn工作。在那时,LinkedIn只有不到800万用户。Goldman在之后的研究中创造出新的模型,利用数据预测注册用户的人际网络。具体来讲,他以用户在LinkedIn的个人资料,来找到和这些信息最匹配的3个人,并以推荐的形式显示在用户的使用页面上——这也就是我们熟悉的“你可能认识的人”。这个小小的功能让LinkedIn增加了数百万的新的页面点击量。从此,数据在LinkedIn的重要性被不断提升,而Goldman的角色就是一位数据科学家。
  曾经投资过Facebook,LinkedIn的格雷洛克风险投资公司把数据科学家描述成“能够管理和洞察数据的人”。在IBM的网站上,数据科学家的角色被形容成“一半分析师,一半艺术家”。他们代表了商业或数据分析这个角色的一个进化。
  真正区别数据科学家与传统职位的是对于商业的强烈敏感,以及以何种组织来处理商业问题的影响力,把研究结果传达给商业和IT界的决策者们。优秀的数据科学家将不仅仅处理商业问题,他们还要有具备发现对于公司影响最大的问题的能力。Anjul Bhambhri是IBM的大数据产品副总裁,她认为 “数据科学家是一个好奇的,不断质疑现有假设,能盯着数据就能指出趋势的人。这就好像在文艺复兴时期,一个非常想为组织带来挑战并从挑战中学习的人一样。”
  数据科学家必须要通过大量的数据产生对商业发展的洞察力。他们应该能推理出数据上尚未显示出来的被掩盖的事实和趋势。
  提出“数据科学家”这个词的Thomas H. Davenport 和 D.J. Patil在他们的文章中谈到数据科学家的能力:数据科学家倾向于用探索数据的方式来看待周围的世界。把大量散乱的数据变成结构化的可供分析的数据,还要找出丰富的数据源,整合其他可能不完整的数据源,并清理成结果数据集。
  新的竞争环境中,挑战不断地变化,新数据不断地流入,数据科学家需要帮助决策者穿梭于各种分析,从临时数据分析到持续的数据交互分析。数据科学家会遇到技术的局限性,但不会让技术阻扰他们寻找新颖的解决方案。当他们有所发现,便交流他们的发现,建议新的业务方向。通常他们很有创造力地展示视觉化的信息,也让找到的模式清晰而有说服力。他们会把蕴含在数据中的规律建议给产品经理和主管们,从而影响产品,流程,和决策。
  Nate Silver利用收集到的数据,在美国2012年总统大选预测对了50个州的投票结果以及最终的大选的结果。数据科学家们正在向世界昭示他们愈来愈重要的作用。
  在可见的未来,数据科学家这个新兴职业将愈发活跃。当他们在硅谷的各大科技公司站稳脚跟后,更多的传统行业将很有可能拥抱这个目前还不被大多人了解的群体,因为他们在大数据分析领域的聪明才智可以为公司节省上千万的资金并且发现更具价值的投资方向。
其他文献
炼油厂汽油洗涤废碱液经磷酸三丁酯配合萃取后,萃余液中还残留高浓度COD和酚类,采用SBR活性污泥法对其进行处理。接种污泥进行两个阶段的驯化,第一阶段(1-30d),以苯酚为碳源;第
多年以来.“影视剧版权大战”、“同质化严重”和“台网联动”一直是中国视频行业的3个关键词。由于视频行业的玩家过多,影视剧版权居高不下,视频行业一直处于赔本赚吆喝的非良
前不久,高晓松声称音乐免费时代结束,知乎上很多人关心并讨论,未来收费音乐到底是向听众收,还是向媒介收?一些数字音乐从业者对此做出了自己的分析。
在120℃DMF溶液中,采用10mol%CuI作催化剂,200mol%Na2CO3作碱进行C-S偶联反应,合成了一系列杂环硫化物。该方法无需任何配体,同时具有经济、高效等特点。产物的结构经^1H NMR
随着录井现场信息化、网络化的深入推进,生产数据传输链路安全以及用户信息安全越来越受到重视.为避免录井应用软件和生产数据被他人窃取或非法复制,录井信息服务中心将加密
从原理和方法上比较了近年来在岩屑录井定量化方面出现的X射线荧光法、X射线衍射法和7能谱法3种新技术,分析了各技术的特点,指出了在岩屑量化分析中容易出现的认识误区,认为这3
“服装打版”是传统服装定制过程中,最考验裁缝技艺的步骤。把服装设计图画出纸样,随后根据画出的版样裁剪布料,再进一步缝制,一件衣服的成功多在细节仰仗裁缝的打版经验。比如不
很多时候看似认知科学和现实无关,但是其实它和每个人的现实生活工作是高度相关的,就像互联网出现十年时间,手机出现十年时间,改变了多少人的生活,改变了多少人的工作。认知科学未来我们已经看到苗头了,已经开始被用到应用上了,未来十年二十年,一定会更加深刻地改造我们的生活,改造我们的工作环境。认知科学第一代我们的潜意识是主宰者  加州大学圣芭芭拉分校的心理学教授迈克尔·加扎尼加(Michael Gazzan
半导体材料TiO2作为光催化剂得到了广泛的研究和应用。着重介绍了几种纳米TiO2薄膜的制备方法,并简要阐述了纳米TiO2薄膜在染料敏化太阳能电池(DSSC)中的应用。
用沉淀浸渍法制备的SO^2-4/TiO2-MoO2-In2O3三元超强酸为催化剂合成季戊四醇四异辛酸酯。考察In的添加量、焙烧时间、焙烧温度对三元超强酸催化剂催化性能的影响,同时采用正