深度学习:用计算发掘数据价值

来源 :微型计算机 | 被引量 : 0次 | 上传用户:thelkiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  深度学习(Deep Learning)是一个革命性的研究方式,它将改变数据分析行业的游戏规则。
  2015年3月18日,一年一度的GTC大会(GPU TechnologyConfenence)在美国加利福尼亚州圣何塞举行。这已经是英伟达(NVIDIA)举办的第六届GTC大会,在本次会议上,一个普通大众不太熟悉的名词被不断提起,它就是深度学习(Deep Leaming)。什么是深度学习?它将带来怎样的变化?GPU或者说并行计算将在其中扮演怎样的角色?对于这些问题,我们在本次GTC大会上都能找到答案。
  什么是深度学习?
  深度学习的概念源于人工神经网络的研究,它是一种包含多层感知分析的学习结构。虽然它的起源最早可以追溯到五六十年前,但是严格意义上的深度学习诞生于1995年的贝尔实验室,因此它实际上是一个非常新的研究方式。深度学习是机器学习领域内增长最快的分支,通过划分更多的层级,研究人员可以训练计算机通过大量的数据筛选来实现自我训练。
  将分析结构分为许多个层级,从而涵盖从简单到复杂的各种概念,这就是深度学习中“深度”二个字的由来。每一层都会将信息分类,将其细化然后转到下一层。比如一套人脸识别系统,第一层可能会寻找简单的边缘,下一层可能会寻找那些构成矩形或圆形等简单形状的边缘,第三层可能会识别眼睛、鼻子等特征,在五层或六层之后,神经网络就能够将这些特征整合起来。深度学习的第一个成果就是1998年研发出的手写识别功能,它在银行等机构取代了人工辨识签名的工作。其后,深度学习开始被广泛用于诸如语音识别、图像识别等非结构化数据分析领域。
  它将改变游戏规则
  深度学习对于普通个人来说可能会显得比较陌生,但是对于大量立志于互联网领域的企业来说,深度学习却是一个可能改变游戏规则的工具。深度学习如何发挥作用呢?对于这个问题,由应用的研发者来回答可能更合适一些。因此,此次GTC大会期间英伟达专门邀请百度进行主题演讲,并且由百度美国研究中心的技术专家来针对深度学习的应用进行了介绍。
  目前百度正在开发一套计算机视觉系统Deep lmage,Deep Image的主要优势建立在一套专门用于深度学习的超级计算机Minwa上这一套系统包含36个服务器节点,每一服务器节点配备了两颗6核英特尔至强E5-2620处理器。每个服务器包含4颗英伟达Tesla K40mGPU以及1个FDR InfiniBand,因此拥有高性能、低延时的特点,其理论最高性能约为0.6千万亿次浮点运算。凭借这套目前深度学习领域排名第一的超级计算机,研究人员可以使用与其它深度学习项目相比规模更大、质量更好的训练数据。
  深度学习改变了过去依靠人工来制定规则造成的准确率天花板,当大数据时代来临之后,我们可以为深度学习系统提供远超过以往的数据量,同时也可以依靠更强大的计算性能来处理这些数据。深度学习采用的端到端的工作模式,将会自动构建多层次的特征识别结构,并且根据数据量的规模来不断优化数据分析模型。就目前来看,在应用深度学习技术之后,数据量、计算能力的增长与准确性的增长,将在很长—段时间里保持一个线性增长。这就意味着我们在建立新的数据分析模型时,不需要像过去那样人工建立复杂的模型,而只需要设定不同的层次、提供足够的标准数据和计算能力就可以了。如果说过去我们是制造一个复杂的工具来完成工作的话,那么深度学习就好比我们是在培训一个员工来让他替代我们工作,而且他是可以不断成长的。
  GPU:大数据时代的“核”动力
  为什么深度学习这个数据分析领域的技术会成为此次GTC的关键词呢?很简单,因为深度学习的实现需要规模庞大的并行计算能力,而这恰恰是英伟达GPU的强项。深度学习算法的进步取决于处理巨量数据的庞大计算能力,使用CPU来工作成本太高、不切实际,但是对于GPU来说则恰恰相反。GPU高性能的并行计算能力能够快速有效地满足深度学习的需要,其训练过程需要的服务器更少,运行速度更快。在这种情况下,本届GTC上黄仁勋主题演讲的4个部分都围绕着深度学习展开也就不难理解了。
  GTC大会自然少不了GPU这个主角,这次英伟达带来的是最新的TITANX显卡。它基于Maxwell架构,拥有80亿个晶体管和3072个CUDA核心,可以实现7万亿次单精度浮点运算和12GB的帧缓冲。对于这块最牛显卡的实际表现,大家可以关注我们的深度评测,在这里就不过多介绍70除了已经发布的显卡,英伟达还公布了下一代GPU架构的信息。根据英伟达的介绍,新的帕斯卡(Pasc81)架构的综合效能将是麦克斯韦(Maxwell)的十倍。
  英伟达一直在推动GPU性能的提升以及基于GPU的并行计算技术的发展,可以说在最近十年里,GPU计算技术经历了从无到有、全面爆发的快速增长。从现场的一张PPT我们看到,从2008年到2015年GPU计算以及CUDA应用的规模实现了超过10倍的增长。这既离不开英伟达在背后的推动,但是也说明数据计算领域需求的变化:从过去结构化的数据计算为主向现在以非结构化的数据计算为主的转变。在这当中,深度学习也许会是下一个快速增长的领域。
  GPU计算对于深度学习的推动在业界最知名的图像识别挑战赛上表现得最为明显。随着深度学习的基础从视觉计算进入到深度神经网络领域,AlexNet模型的正确率从2011年的74%提高到2012年的84%,现在更是超过了90%。特别是最近—段时间,包括百度、微软、谷歌在内的核心互联网企业不断刷新其正确率,从现场展示的一张图表中我们可以看出,今年开始的短短两个月时间里,他们先后剧新了世界纪录,ImageNet图像识别挑战赛中识别的错误率被刷新到了5%以下,这已经超越了普通人的判断能力。这种数字的变化,可以称为始自2012年的深度学习大爆炸。之所以出现这种变化主要是三方面的原因一是深度神经网络算法的兴起,二是大数据的兴起,爆炸性增长的非结构化数据为深度学习提供了足够丰富的素材,三是基于GPU的并行计算性能的快速提升,为深度学习的数据分析提供了基础。   作为一个比较前沿的研究技术,深度学习目前还处于一个有待推广的阶段,特别是很多中小型的创业公司还无法获得足够的资源来进行大规模的深度学习。在这种情况下,英伟达在本届GTC上推出了一个“盒子”——桌面级的深度学>-37具DIGITS DevBox。它使用英伟达推出的用于深度学习的DIGITS软件,用于处理数据、配置神经网络,监测模型的改变。
  写在最后
  深度学习也许不像语音识别、图像识别、自动驾驶等面向用户的新技术那么引人注目,但是它却是这些技术未来进一步演进、成熟的基础。就像百度通过深度学习改进图像搜索的体验、或者科大讯飞利用深度学习提高语音识别的准确率那样,深度学习将会在底层为提高用户的生活体验带来帮助。不只是这些,深度学习对于非结构化数据分析模型建立的帮助还会在更多方面带来改变,比如疾病和药理的分析,或者其他一些不那么广为人知的方面。
  Tips
  李彦宏在今年两会上有两个提案,一个是医疗方面的,一个是中国大脑,都是关于互联网与服务的。百度现在想要做的事情,就是要把任何服务连起来。腾讯把人和人连起来,阿里把人和商品连起来,百度则是把人和服务连起来。把人和服务连起来的一个核心,就是人工智能。
  在这个思路下,我们要大量投入技术,还是连接人和服务,连接人和服务就是有了产品,有人使用;有人使用以后就能提供很多的数据,有数据以后就需要人工智能,反过来又要促进产品,或者整个生态圈的变化,这就构成了一个简单的闭环。百度美国研究中心的主要工作就是通过人工智能实验室解决语音识别和图像识别的问题。百度搜索量以前百分之百都是文字,现在预计语音或者图片搜索量会大幅增长,因为手机增长非常快。在未来五年之内,50%的需求来自于语音和图片,所以我们必须提前准备好。
  孙子说过多算胜算,用现在的说法就是计算能力强的就有优势。班固也讲过,要见多才识广,你看的例子越多经验也就越多,你的智能程度就变得更高。孟子讲过,观事物要从大看,也要从小看,能看到细微之处才是真正的能力所在。实际上,深度学习就是往这个方向走,我们用特别大的模型看特别多的东西,这个东西不光是缩小的图片,还有巨大的、有很多细节的图片,并且这种图片有各种各样的变形,巨大的数据量结合深度学习的办法,让我们能看到更好的结果。以前传统机器学习技术到了一定程度以后,性能就无法提升了,再提供更多的数据给它都没有用。但是深度学习就不一样,你给它更多的数据,只要能算得动,我们就可以拿到更好的结果。百度希望推动这个过程,看看到底能做到什么程度。
其他文献
Windows 11全方位解析與实战体验  毫无疑问,负责管理计算机硬件与软件资源的操作系统是最为重要的软件,操作系统直接决定着用户使用电脑时的最终体验。Windows 95的出现让人首次感受到了视窗化、图形化的界面要比命令行式的DOS方便、好用很多;而启动缓慢、稳定性差的Windows Me则让人有抛弃Windows的冲动;好在VVindowsXP拯救了微软,但接下来的Windows Vista
基于高性能802.11n的智能无线架构的新一代企业无线网络,越来越多的行业应用开始正式商用。如Wi-Fi实时定位、车载Wi-Fi设备的高速漫游以及Voice over WiFi等等。通过基于Wi-Fi的实时定位功能,用户可以实时追踪企业的资产和人员,目前在医疗,教育,制造以及交通运输行业等中得到了较为广泛的应用。而通过在公交车,出租车和城际高速开车上安装车载Wi-Fi高速漫游设备,可以结合现在的W
2020新年伊始,科技行业最大的盛会就已经来了。2020年1月7日-10日,消费电子展(CES 2020)在美国拉斯维加斯举办。作为全球最大的消费电子展,CES被誉为全球科技风向标,它不仅成为最新科技的聚集地,也代表了全新的技术、产品的发展方向。今年的CES展会囊括了消费数码、5G通信、人工智能、自动驾驶、智能家居等领域的最新产品和尖端技术,作为PC硬件杂志,MC更倾向于将目光集中在IT硬件产品领
众所周知,3月8日是属于各位女性朋友们的节日,想必这一天各位朋友们都被商家们“女神节”或者“女王节”的购物宣传给狂轰滥炸了。不过,对于鬼泣粉丝来说,今年的3月8日同样也有着特殊的意义——时隔十一年之后,CAPCOM在这一天正式发布了《鬼泣》系列的正统续作《鬼泣5》。自发布以来,《鬼泣5》的口碑一路走高,IGN给《鬼泣5》打出了该系列游戏的最高分9.5,Steam评分在本文截稿之前依旧保持在92%的
首先在外观上,iQOO 5 Pro赛道版与此前iQOO 5的配色截然不同,其将跑车上常用的碳纤纹理呈现在采用磨砂工艺玻璃后盖的下方,利用黑色和蓝色共同营造出高性能赛车的氛围感。同时3D曲面的后盖边上还有两道蓝色光线,与iQOO初代的暗夜光轨有些相似,但更像一条笔直的赛道,营造出极致的速度感。  如何更好地将iQOO 5 Pro与BMW M Motorspor t结合?这是道难题。6名参与iQOO
测试手记:和高端的FX 8150一样,FX 4100处理器的超频能力也相当出色。功耗和温度控制能力更是比前者好了太多。刚刚关机,立马拆下处理器,触摸其表面温度几乎和室温相当。此外,FX 4100对AVX、XOP和AES等新指令集支持良好。其中AES指令让它在面对密码学计算应用时,能为你带来约10倍于其他同价位平台的超强性能。  我们在测试FX 8150的时候,就知道AMD的“推土机”不止有4模块8
随着物质生活的不断丰富,游戏玩家对于外设的追求也越来越高。特别是在FPS游戏火热的当下,以往那些单纯的多声道、RGB背光游戏耳机已然不能满足部分高端玩家的需求,外观设计不过于浮夸、调音足够优秀并且具备无线连接功能的游戏耳机逐渐成为了他们的心头好。而ROG风行GO电竞耳机恰好具备以上这些特性,并且它还首创USB-C接口无线收发器,采用Al降噪麦克风,希望凭借这些设计来吸引更多的高端玩家。   由繁至
转眼就进入5月了。在这半个月里,很多打算装机的DIY爱好者内心情绪如坐过山车般波动,饱受煎熬。原本,传闻英伟达正式停产了旧款使用GA106-300GPU核心的RTX3060显卡,后续将会用新版本使用GA106-302GPU核心的RTX3060显卡作为替代。GA106-302GPU核心的算力减半,但不影响游戏性能。这对于苦寺J赞机时机,饱受局价显卡則熬的PCI兀豕来说,确实是振奋人心的消息。盼望着,
课余时间枯燥乏味,宅在寝室百无聊赖,这让不少“学生党”都想起在新的一年添置一台电竞主机,来十高自己的校园生活。不满足于入门级硬件的赢弱性能,却又奈何装机预算缺口较大,纠结于此的一些“学生党”们就只有把关注的目光集中到了闲鱼、转转这类线上二手交易平台上。诚然,在闲鱼、转转上购买二手PC硬件可以节约资金, 但这类线上二手交易平台上也充斥着不少假冒、伪劣、翻新产品,其中的套路令人防不胜防,那么对于那 P
目前投影机大致可以分为两类,一类是普通家用型,这一类新兴品牌较多,像极米、坚果、米家等都是具有代表性的品牌,当然,像明基、宏碁等这类传统品牌也有涉足;另一类是商教型,这类产品主要是传统品牌居多,主要有明基、宏碁、奥图码、爱普生、索尼等。以往,我们体验得较多的是个人消费类的家用投影机,本期我们将给读者们换个“口味”,带来了一款主打商用的投影机—理光PJ YU4000。   外观设计常规,接口丰富