中国HPC 百万亿次是这样炼成的

来源 :计算机世界 | 被引量 : 0次 | 上传用户:king5440
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  曙光5000A 打进全球超级计算机500强(Top 500)排行榜前十榜单,使得中国成为继美国之后,世界上第二个可以研发、生产百万亿次超级计算机的国家。
  
  “百万亿次计算机到底是一个什么概念?用它计算一天,相当于用家用的PC计算33年。”上海超级计算机中心姚继锋博士这样解释曙光5000A。
  在前不久公布的全球超级计算机500强排行榜中,装载了微软Windows HPC Server 2008操作系统的曙光5000A实现了百万亿次的突破,以峰值速度233.47万亿次、Linpack值180.6万亿次的成绩,跻身世界超级计算机级计算机前十名。
  曙光5000A也是在美国之外的惟一进入前十名的超级计算机。由此,中国成为世界上第二个可以研发、生产百万亿次超级计算机的国家。
  
  奇迹诞生于地下车库
  
  2008年除了北京的奥运场馆外,中国科学院计算所地下车库是一个最令人兴奋和激动的地方。因为,中国史上最“牛”的计算机以及最“牛”的运算纪录就是诞生于这里。
  2008年9月初,中国科学院计算所地下车库一片忙碌,这里正在紧锣密鼓地搭建一个数据中心。造价两亿元人民币的1920台服务器已从天津工厂运抵北京,由于机器太多、太沉,一楼的地面无法承受,机器们只能“屈尊”于这里。
  整个数据中心的搭建非常神速,仅仅用了10天左右的时间。仅一个晚上,现场共计700条、总长达60公里的光纤居然全部部署完毕——原因很简单,曙光公司调动了可以调动的全部人员,包括秘书、财务等行政人员。
  由于大规模的计算集群对于硬件的稳定性要求非常高,一台机器的一条内存出问题就会导致整个任务失败。因此整个过程中,来自曙光的工程师们一直轮流值班,并在现场准备了大量备份硬件,一旦发现问题就立刻上前更换。
  这样夜以继日地工作,目标只有一个: 赶上11月在美国奥斯汀举办的第21届超级计算机大会,跻身到世界权威的Top 500超级计算机排名的前列。这份自信来源于最近的两次测试: 6月,在首台安装了Windows HPC Server 2008的服务器上进行的单节点测试中,运算效率达到了86%,为同期各类操作系统中最高; 7月,在32节点测试中,运算效率达到84%,几乎实现了节点数目-运算能力的线形扩展。
  从9月1日开始搭建计算机,到10月28日完成最后测试结果,微软和曙光的工程师团队与这台重50吨的超级计算机“同吃、同住、同劳动”了七周半之久,多次在最后的期限前奇迹般地实现了既定目标。
  9月28日,曙光5000A的浮点运算能力达到87.6 T; 9月29日,系统运算能力突破百T大关,达到116.3 T,得以赶在世界超级计算机大会的截止日期——10月1日之前顺利申报全球超级计算机的Top500; 10月9日,达到了140.3 T的新高; 10月13日凌晨两点左右,运算能力达到167.4 T,突破了此前曙光预计的160 T,“创造了中国高性能计算的历史”; 在经历了10月25日的174.9 T和10月26日的179.8 T之后,2008年10月28日,曙光5000A得到了它提交给世界超级计算机大会的最终结果——180.6 T。
  要知道,这些成绩是在一个由地下车库改造成、占地达2000平方米、几乎完全不通风、环境噪音接近70分贝的数据中心中诞生的。曙光和微软的工程师们平均每天在这里工作14小时以上,在工作现场的机柜旁、停车场的角落里,不时可以看到悄然入睡的疲惫身影。
  
  冒险者的双赢
  
  曙光公司副总裁聂华坦承,选择跟微软合作,多少有一点冒险的成分。之前,曙光的超级计算机一向依托于Unix或Linux高性能操作系统环境。
  从2007年选择微软WCCS 2003开始,曙光和微软在高性能计算机上开展合作。“当高性能计算做到一定境界的时候,曙光真正关心的是能否对整个高性能计算产业经济发挥作用,能否让高性能计算机使用得更普及。”聂华说,“而Windows操作系统显然会让用户感觉更亲切,调试更方便,界面更友好,这是合作的基础和前提。”
  对微软而言,将初出茅庐Windows HPC Server 2008在这么大规模的计算集群上部署和应用,尚属首次。此前,微软HPC团队服务过的最大客户是美国国家超级计算应用中心(NCSA),当时构建的超级计算机由1200个双路四核的服务器节点构成。而此次曙光5000A由1920个四路四核的服务器节点构成,规模是作为高性能计算技术全球领先者的NCSA拥有的超级计算机的4倍,这对微软中国HPC团队来说,挑战非同寻常。
  在9月29日取得116.3 TFlops的运算结果之后,工程师们在10多天的时间里一直无法取得任何新的突破,有人质疑,Windows HPC Server 2008真的是如此大规模计算集群的正确选择吗?这个时侯,顶住压力,不放弃成了惟一的选择。在总结了前段时间屡屡失败的教训后,终于在10月9日,工程师们将曙光5000A推向了140.3T的新高,并随后多次刷新了中国超级计算机运算纪录。
  
  评论
  技术全球化有利于自主创新
  毫无疑问,曙光5000A超级计算机打进全球高性能计算机Top500前十名榜单,是中国自主创新的一个典范。
  曙光5000A不仅在全球超级计算机500强的排行中取得亚洲第一、全球第十的骄人成绩,更是向世界表明: 中国已经成为继美国之外,第二个可以研发、生产百万亿次超级计算机的国家。
  这一成绩背后值得关注的一点是,支撑5000A运行的是微软的高性能计算平台Windows HPC Server 2008,这也是它第一次在大规模的超级计算机上亮相。为了和曙光一起见证“中国高性能计算历史”,微软中国HPC团队动用了来自全球的骨干技术力量,可谓不惜血本。最终,曙光5000A使微软向全球表明了它在高性能计算领域中所潜藏的巨大能量和实力。
  从这一角度来看,曙光5000A是技术创新全球化的一个重要案例。曙光恰好抓住了跨国公司微软向全球公司转变、研发力量东移所带来的创新机遇。事实上,在跨国公司研发全球化的趋势下,利用国际资源与产业结构调整来开拓自己的创新平台和创新产品,提高国家的创新能力正在成为科技界的共识。
  技术全球化有利于自主创新。自主创新,从来就不是封闭创新。高科技发展的一个重要规律,就是在竞争中合作,既竞争又合作,这比关起门来搞竞争要强得多。
  因此,我们呼吁业界总结经验、解放思想,反对闭关自守,克服迷信权威的思想,适应研发全球化和经济全球化的挑战。在跨国公司研发全球化的趋势下,充分利用国际科技和产业资源,明白自己真正需要什么资源,拓展哪方面能力,从而获取创新的主要收益。(文/毛江华)
其他文献
“Intel wants to be inside everything(英特尔无处不在)。”这是芯片巨人英特尔的梦想,也是它现在最真实的写照。  9月13日15日,英特尔信息技术峰会(Intel Developer Forum,IDF)在美国旧金山拉开帷幕。作为全球最负盛名的技术峰会之一,本届IDF抛开了以往严肃的技术面孔,以 “The future saved a seat for you(未
云计算,这一概念自诞生起就在炒作与现实意义的争论中变得异常火爆。被认为蕴含着巨大潜力的云计算能否从根本上改变我们的生活方式?以云计算为基础的在线协作能为IT技术的未来带来哪些改变?未来我们的协作与沟通方式又将发生怎样的变革?带着这些问题,本报总编辑孙定与Zoho公司全球CEO Sridhar Vembu进行了深入交流。    在线办公  大势所趋  在线办公能够帮助IT企业提高生产率,这是它全球化
本报讯近日,像大多数NBA球队一样,圣安东尼马刺队也在季后期间认真研究球员统计数据,以寻找更好的球队管理方法。商业分析软件与服务领导厂商SAS的可视数据发现解决方案(SAS Visual Data Discovery)向马刺队提供了带有交互式数据、可视化功能的高级分析与探索式数据分析工具,为更好的分析结果、更迅速的决定和更有效的分析结果呈现奠定了基础。
“绿色”已经成为当今众多数据中心追求的综合目标。在数据中心环境里,要切实实践“绿色”,对物理连接层的要求必须是更高速度、更大密度、更高可靠性、节省资本和运营开支等。如何满足这些要求?  12月9日,光通信领域的领先厂商康宁公司亮相“2010 DatacenterDynamics北京数据中心会议”,给出了以上问题的答案——采用光技术可以帮助人们建设绿色数据中心,最大程度地降低对环境的影响。  康宁公
前不久,BMC公司董事长兼首席执行官鲍秉辰(Bob Beauchamp)在北京举行了媒体见面会。有着BSM(Business Service Management,业务服务管理)之“父”之称的鲍秉辰除了继续宣传其BSM的理念之外,重点介绍了BMC在云管理方面的产品和计划。  “BMC是唯一专注于BSM服务管理的企业,我们的目标就是要提供最名副其实的IT管理平台,这个平台能跨越云、虚拟化平台和大型机
费用问题仅仅是制约速通卡普及的表面原因,要真正实现速通卡的普及,加强技术研发,制订出统一的标准才是根本所在。   记者日前在北京市八达岭高速清河收费站发现,已经开通了3个月的速通卡专用车道却是少人问津。在半个多小时的时间里,记者仅仅看到一辆奔驰车通过速通卡专用车道。与之相比,其他人工收费点则是有不同程度的排队现象。   据了解,如今办理速通卡的多为单位,少数个人办理者也多是中高档轿车车主。记者随机
菏泽是著名的牡丹之乡,它位于山东省西南部,曾经是古代中原地区重要的政治、经济、文化中心。数千年的变迁,如今菏泽成了山东省17个地级市中最落后的城市之一。这个拥有近800万农村人口的巨大金矿,成为电脑下乡的“必争之地”。    一大早,菏泽的理想海尔电脑专卖店渠道经理滕茜的手机铃声便此起彼伏,她随身带着3部手机,可一旦业务忙起来,还是应付不过来。“这几天电话特别多,都是下面的经销商来要货的。我们第一
9月16日,握奇数据系统有限公司博士后科研工作站揭牌仪式在北京交通大学正式举行。中关村科技园中国北京(望京)留学人员创业园总经理李涛和握奇数据总裁王幼君为本次仪式揭牌。目前,科研工作站8名指导老师已经确认,此外5名博士后科研工作者也陆续到岗。该科研工作站的成立意味着握奇将依托高校博士后工作站和企业技术研发中心,引领企业前瞻性的研究方向。
“2009年的中国服务器市场很难做,这是绝对的。无论是国际厂商还是国内厂商,日子都不会好过。尤其是上半年,由于购买方收得太紧,服务器厂商会感觉异常艰难。”这是计世资讯资深分析师郭畅对2009年中国服务器市场的判断。  在记者对包括联想、曙光、浪潮在内的国产服务器厂商进行情况摸底的时候发现,2009年国产服务器厂商面临的形势的确相当严峻。一方面是因为制造业、中小企业这些国产服务器厂商的主要客户群需求
做一个超人,拥有超过普通人的智力或者体能,这是很多人小时候的梦想,而未来这一切并非不可能,人机接口和医疗植入装置有望让这一梦想变为现实。    试想一下:如果你只要把软件下载到你的大脑,就能学会驾驶直升机;再试想一下:如果你的眼睛可以看到几公里外黑暗中的物体,旁边还显示物体的相关数据,这些是不是很有吸引力?来自《黑客帝国》和《终结者》等影片的这些科幻场景在将来也许真的能成为现实,这要归功于医疗植入