神威太湖.太湖之光 摘得世界超算桂冠的主要原因是什么

“神威·太湖之光”获世界超算冠军 中国连续4年摘冠
超级计算机“神威·太湖之光” 东方IC 资料图新一期全球超级计算机500强(TOP500)榜单14日在美国盐湖城公布,中国“神威·太湖之光”以较大的运算速度优势轻松蝉联冠军。算上此前“天河二号”的六连冠,中国已连续4年占据全球超算排行榜的最高席位。TOP500榜单每半年发布一次。在今年6月的排行榜上,由中国国家并行计算机工程技术研究中心研制的“神威·太湖之光”横空出世,以每秒9.3亿亿次的浮点运算速度出人意料地夺冠。这个速度是原冠军中国“天河二号”的近三倍,更重要的是“神威·太湖之光”实现了包括处理器在内的所有核心部件全部国产化。此前,由中国国防科技大学研制的“天河二号”超级计算机已在TOP500榜单上连续六度称雄。在最新榜单中,“天河二号”依然以每秒33.86千万亿次的浮点运算速度排名第二。除“双星闪耀”外,中国超算总体表现也很出色。今年6月,中国首次把上榜总数长期独占鳌头的美国“拉下马”。而这次,中美打了个平手,以171台上榜数量并列第一,两国上榜超算约占榜单总数的三分之二。国际TOP500组织在一份声明中写道,一年前美国以199台上榜超算保持明显优势,而中国只有109台。但现在,最新公布的榜单“见证了中国和美国并驾齐驱的超算优势”。TOP500榜单始于1993年,是对全球已安装的超级计算机“排座次”的知名排行榜,由美国与德国超算专家联合编制。从榜单前10名看,中国“双星”之下,第三至第十名依次是美国的“泰坦”、“红杉”、“科里(Cori)”,日本的“Oakforest-PACS”、“京”,瑞士的“代恩特峰”以及美国的“米拉”和“三一”。其中,“科里(Cori)”和“Oakforest-PACS”都是“新面孔”。“代恩特峰”原来排名在“三一”之后,经升级后反而排到“米拉”之前,但仍待在第八的位置上没有变动。总体而言,计算能力超过每秒千万亿次的上榜系统已从2008年6月的一台增至如今的117台。排行榜主要编撰人、美国田纳西大学计算机学教授杰克·唐加拉对新华社记者说,下一步超算将朝着百亿亿次计算能力进军,这些下一代超算“将是一个全新的品种,不仅速度快,而且以全新方式处理大数据,从而开辟人工智能、数据科学和模拟的新途径,带来新的见解”。
正文已结束,您可以按alt+4进行评论
责任编辑:zhaoyhuang
扫一扫,用手机看新闻!
用微信扫描还可以
分享至好友和朋友圈
Copyright & 1998 - 2017 Tencent. All Rights Reserved全球最快神威·太湖之光超级计算机携手世界最大超算竞赛|超级计算机|世界最大|超算_新浪科技_新浪网
全球最快神威·太湖之光超级计算机携手世界最大超算竞赛
  新浪科技讯 11月16日消息,ASC16全球超算大会上,2017 ASC世界大学生超级计算机竞赛(ASC17) 正式启动,所有希望参与这一世界最大规模和最激烈超算赛事的全球高校即日起开始报名。同时,竞赛组织方亚洲超算协会还宣布世界最快超级计算机“神威·太湖之光”将成为ASC17的竞赛平台。
ASC17学员报名现场
  “神威·太湖之光”是目前世界上唯一一套计算性能突破10亿亿次的超级计算机,部署在国家超算无锡中心,其峰值性能达到12.5亿亿次/秒,持续性能为9.3亿亿次/秒,在SC16大会公布的最新一期超算Top500榜单蝉联了全球最快超级计算机的桂冠。全球最快的超级计算机作为ASC17的竞赛平台,无疑会让所有参赛大学生队员感受到最尖端超算技术的魅力。而“神威·太湖之光”作为完全使用中国自主研发芯片构建的超级计算机,将使得参赛队员能够接触到新的处理器和系统架构,挑战更大的同时也将极大扩展参赛同学的技术视野。
“神威·太湖之光”超级计算机
  亚洲超算协会总监阎彦介绍,ASC17共分为三个阶段:2017年1月9日前为报名阶段,全球高校组织参赛队伍到官网提交报名,参赛队伍由1名指导老师+5名参赛队员构成,其中参赛队伍的5名学生必须是在校本科生;预赛将在17年1月-3月之间进行,根据组委会统一公布的竞赛命题要求,各参赛队提交相关书面方案,由评审委员会评选出进入决赛的团队;总决赛将在17年4月中下旬举办,入围队伍将在浪潮提供的超算设备上,在满足竞赛规则要求下,根据自己对应用的优化理解组建各自的超级计算机系统,现场进行相关的应用测试、程序优化及竞赛呈现,并将在“神威·太湖之光”上完成挑战赛题,最终依据竞赛成绩与表现决出总冠军及各奖项。
  据悉,ASC17世界超算大赛将由亚洲超算协会、浪潮集团、国家超算无锡中心和郑州大学等单位合作举办,其中郑州大学最新部署的采用Intel &Knights Landing的超级计算机也将在本次竞赛中发挥重要平台作用。
  ASC 世界大学生超算竞赛(ASC Student Supercomputer Challenge)由中国发起组织,并得到亚洲及欧美相关专家和机构支持,旨在通过大赛平台推动各国及地区间超算青年人才交流和培养,提升超算应用水平和研发能力,发挥超算的科技驱动力,促进科技与产业创新,是目前全球范围内规模最大、参与人数最多的大学生超算赛事。2016年的ASC大赛共有全球6大洲148所高校的175支队伍报名参赛,最终由来自中国的华中科技大学和上海交通大学分别获得冠亚军。
尽管征战多年,但360手机仍处于市场培育期,其在品牌、研发、渠道...
继金立、小米在印度陷入专利纠纷之后,OPPO和vivo也卷入专利诉讼...
无可挑剔的商品品质与价格优势带来的高用户粘性,新零售的本质是...当前位置:
每秒10亿亿次!我“神威·太湖之光”成世界最快超算
左下图 一名研发工程师展示“神威·太湖之光”所使用的“申威26010”众核处理器(6月16日摄)。这个快到令人咋舌的超级计算高手,就是我国自主研制的“神威·太湖之光”计算机系统。
上图 “神威·太湖之光”超级计算机(6月20日摄)。
一名研发工程师展示“神威·太湖之光”所使用的“申威26010”众核处理器(6月16日摄)。该处理器采用64位自主申威指令系统,峰值性能3.168万亿次每秒,核心工作频率1.5GHz。“神威·太湖之光”里安装有40960个这样的处理器。
“神威·太湖之光”超级计算机的交换机网线(6月16日摄)。“神威·太湖之光”采用大规模高流量复合网络体系结构,实现全系统高带宽、低延迟通信。
  想像一下,滴答一声,就能计算十亿亿次,这是多快的运算速度?
  如果把200多万台2016年生产的普通电脑加起来,只能跟它打个平手;它1分钟的计算能力,相当于全球72亿人同时用计算器不间断计算32年。
  这个快到令人咋舌的超级计算高手,就是我国自主研制的“神威·太湖之光”计算机系统。6月20日德国法兰克福举行的国际超算大会发布了超级计算机TOP500榜单,“神威·太湖之光”以近3倍于第二名的运算速度摘得桂冠。更令人振奋的是,它实现了包括处理器在内的全部核心部件的国产化。
  核心部件突破封锁,这个冠军货真价实
  我国已经步入信息时代数十年,但是从个人电脑到超级计算机,中国科研人员都有一种说不出的痛:CPU基本依赖进口!
  2015年4月,美国政府宣布,把与超级计算机相关的4家中国机构列入限制出口名单,其目的是想限制中国超级计算机的发展。这直接导致采购因特尔处理器的“天河二号”未能如期完成攻关目标。
  长期受制于人的被动与屈辱,使我国下决心研发自主知识产权的“神威”系列超级计算机。
  2015年12月,“神威·太湖之光”在国家“863计划”的重点支持下,由科技部、江苏省和无锡市共同出资17.95亿元,在国家并行计算机工程技术研究中心研制成功。
  “在5厘米方寸之间,集成了260个运算核心,数十亿晶体管,达到了每秒3万多亿次计算能力,相当于3台2000年全球排名第一的超级计算机。‘神威·太湖之光’里安装有40960个这样的处理器。”国家并行计算机工程技术研究中心副主任梁军手持一块薄薄的芯片向记者介绍,“神威·太湖之光”的核心处理器“申威26010”在国家“核高基”重大专项支持下,由国家高性能集成电路设计中心研制,具备片上融合的异构众核体系结构,以及具有自主知识产权的指令集和完整的配套软件生态系统。
  采用这块强大“中国芯”的“神威·太湖之光”,不仅一举突破封锁,而且峰值性能、持续性能、性能功耗比三项关键指标均居世界第一。
  据国家超级计算无锡中心主任杨广文介绍,这是全球第一台运行速度超过10亿亿次/秒的超级计算机,峰值性能高达12.5亿亿次/秒,持续性能达到9.3亿亿次/秒,接近“天河二号”的3倍。
  一台超级计算机的能耗几乎与一个小型城镇相当,因此能耗控制也至关重要。
  步入“神威·太湖之光”所在的机房,除了环境空调声,没有其他任何噪音,让人难以相信这里是世界最快超级计算机的安居之地。“系统能效比高达每瓦特60.5亿次,比‘天河二号’节能60%以上。”梁军介绍,这得益于低功耗、高集成度的处理器设计,以及独创的高效水冷技术和高密度的组装工艺,还有软硬件协同、智能化的功耗控制方法,实现了层次化、全方位的绿色节能。
  从拼速度到比应用,国之重器担当大任
  国之重器,重在应用。
  “一个系统先让它好用,才能把它用好。超级计算机作为一种战略资源,只有在应用中才能发挥其引领作用。”杨广文说。
  “十二五”以来,我国“天河二号”连续三年荣膺世界最快计算机,相比之下,我国超算在应用方面却鲜有国际顶尖的成果。因此,关于中国超算应用能力的质疑从未中断。
  航空航天、石油勘探、车船设计、动漫制作、新药研发、生物信息、气候模拟……记者在无锡中心看到,“神威·太湖之光”超级计算机广泛应用在从实体经济到战略领域的诸多方面。
  “有了这套计算机系统,我们可以在30天内完成未来100年的地球气候模拟,这在之前是不可想象的。”清华大学计算机科学与技术系副教授薛巍说,它将全面提升我国应对极端气候事件和自然灾害时的减灾防灾能力,同时大大增强我国在全球温室气体减排谈判中的话语权。
  从2015年底就常驻无锡的国家海洋局第一研究所研究员赵伟说:“过去2—3小时才能发出的海啸预警,我们通过‘神威·太湖之光’计算机,现在最快十几分钟就可以完成。”
  此外,国家计算流体力学实验室运用“神威·太湖之光”对“天宫一号”返回路径进行的数值模拟计算,将为它的返回提供精确预测;上海药物所借助“神威·太湖之光”开展的药物筛选和疾病机理研究,短短2周便完成常规需要10个月的计算,大大加速了白血病、癌症、禽流感等疾病的药物设计进度。
  目前,国家超级计算无锡中心已与北京大学、中科院软件所、中船重工702所、远景能源、清华大学、国家计算流体力学实验室等国内30多家用户单位建立应用合作关系。
  “戈登贝尔奖”被喻为计算机高性能应用领域的诺贝尔奖,在其2016年度6个提名中,基于“神威·太湖之光”的应用就占了3个,分别涉及大气、海洋、材料3个领域,这也是我国首次在此奖项中获得提名。
  江苏省科技厅厅长王秦介绍,江苏将依托这个平台建设高性能计算和信息安全产业园,积极推动自主芯片、并行软件、大数据服务等领域的产业化,培育战略性新兴产业,将无锡超算中心建设成为苏南国家自主创新示范区的推进器,为江苏建设具有全球影响力的产业科技创新中心和具有国际竞争力的制造业基地提供支撑。
[责任编辑:涂胜]全部采用国产处理器构建
“神威?太湖之光”摘世界超算桂冠
&&&&来源:&&&&
&&&&&&字号
人民网法兰克福6月20日电 (记者管克江、王伟健)6月20日,德国法兰克福国际超算大会(ISC)公布了新一期世界500强排名,我国自主研制的“神威?太湖之光”成为全球运行速度最快的超级计算机。三项在“神威?太湖之光”超级计算机上开展的应用课题荣获“戈登贝尔奖”提名,中国超算上榜总数量首次超过美国名列第一。
数据显示,首台全部采用国产处理器构建的“神威?太湖之光”超级计算机,峰值计算速度达每秒12.54亿亿次,持续计算速度每秒9.3亿亿次,性能功耗比为每瓦60.51亿次,三项关键指标均排名世界第一。目前,中国进入世界500强的超级计算机数量已达167台,在计算性能类别上也居于领先位置。
据介绍,入围“戈登贝尔奖”的三项应用分别为中科院软件所与清华大学、北师大合作的“全球大气非静力云分辨模拟”;国家海洋局海洋一所与清华大学合作的“高分辨率海浪数值模拟”;中科院网络中心的“钛合金微结构演化相场模拟”。设立于1987年的“戈登贝尔奖”,被喻为计算机高性能应用领域的诺贝尔奖。
《 人民日报 》( 日 01 版)
(责编:王丽玮、翁迪凯)
善意回帖,理性发言!
使用其他账号登录:
恭喜你,发表成功!
请牢记你的用户名:,密码:,立即进入修改密码。
s后自动返回
5s后自动返回
恭喜你,发表成功!
5s后自动返回
最新评论热门评论
原创推荐|风情小镇
图说浙江|人民电视
24小时排行&|&
人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用
Copyright &
by .cn all rights reserved
人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用
Copyright &
by .cn. all rights reserved当前位置: &
世界超算冠军“神威太湖之光”到底有多强?
扫描到手机
15:44:16 &铁流 & &
运算系统机舱内部超级计算机软件系统主要包括操作系统、编译系统、并行程序开发环境、科学计算可视化系统等四个重要组成部分。具体来说:操作系统系统主要包括对同构技术或异构协同支持,高效能支撑扩张,基础服务内核,全局并行文件系统;编译系统的功能是支持C、C++、Fortran77/90/95等编程语言,支持OpenCL、OpenMP、MPI等并行编程语言,支持编译优化;并行程序开发环境的功能是提供程序接口,支持应用程序的调试和性能分析;科学计算可视化系统由海量数据服务模块、并行绘制与显示模块和可视化映射与操作模块组成。因此,运算系统、存储系统、互联系统、操作系统、基础库、应用软件,以及监系统控、冷却系统、电源系统等都是超算的重要组成部分。因此,一些人称因国产超算使用美国Intel的CPU,因而不具备技术含量,将CPU等同于超算的全部技术的说法显然是非常不科学的。超算不是简单堆砌CPU有媒体引用所谓业内人士声称,&把足够多的手机芯片连起来就能超越天河2号。&但实际上,这个说法也是值得商榷的。因为堆CPU也是一个技术活,体系结构设计的不好,高速互联网络做的不行,系统软件做的不好,储存列阵做的不行,即使堆再多的CPU,超算的性能也上不去。简单粗暴的堆砌CPU根本不可能制造出一台超级计算机,更不要说是能与天河2号相匹敌的超算。另外,哪怕掌握了正确的堆砌CPU的方法,也不是单凭靠堆CPU数量就能获得一台能与天河2号相匹敌的超算。原因何在?因为超算建设不是简单的搭积木式的堆砌CPU即便堆砌了海量的计算卡,但受制于其他方面,比如高速互联网的技术水平,也会导致无法到达理论计算性能。具体来说,高速互联网络的难点在于超算的计算节点之间传输的数据量巨大,延迟要求严格,当互联网络效率不足,就会导致数据拥堵,大幅降低超算整机系统效率。而超算的计算节点越多,对互联网络的要求也就越高。因此,即使想通过堆砌CPU来提升运算能力,也会受限制互联网络的性能,造成这种做法并不能无节制的提升超算的性能受制于诸如互联网络以及其他方面的瓶颈,整机效率被拉低,导致实际性能并没有因为堆砌了更多的CPU而有所提高。另外,堆砌过多的CPU还存在功耗过大、机箱体积过大等问题,非常不利于日后的运营维护和使用,在超算市场基本不具备市场竞争力。正是因为高速互联网络的重要性,相对于在2015年才对中国四家超算中心禁售Intel计算卡,高速互联网络却早就被美国列入技术封锁的名单。在软件系统方面,控制少量计算节点和控制大量计算节点对软件系统的要求近乎于天差地别。软件系统必须保证每个超算计算节点的性能被发挥到最大才能充分挖掘出硬件上的潜力,否则,就会影响超算的整机效率。另外,TOP500头几名的计算节点大多在数千近万,甚至一万个以上,某几个计算节点损坏,并需要更新是常有的事。当计算节点损坏时,软件系统必须做到部分节点损坏时不会发生死机、报错等情况,不影响计算任务的持续。因此,如果没有一个好的体系结构,那么CPU的性能将无法全部发挥出来,而且堆砌的CPU数量越多,整个系统就越复杂,对高速互联网络、存储列阵、监控系统、冷却系统和软件方面的要求也就越高,整机效率的提升也就越难。而体系结构设计能力水平不够高的情况下,单纯堆砌CPU数量,反而会降低整机效率,无法提升整机性能。&神威太湖之光&牛在哪里TOP10新排名&神威太湖之光&刷新TOP500排行榜,依靠的是其强悍的双精浮点性能其高达125PFlops双精浮点峰值和93PFlops稳定性能让世人惊叹。其实,除了拥有举世无双的双精浮点性能之外,&神威太湖之光&还拥有整机效率高,整机功耗低、性能功耗比高,整机体积小等一系列优点。&神威太湖之光&超算拥有40960个计算节点,使用了上海高性能集成电路设计中心设计的国产众核芯片申威26010,采用28nm制程工艺,主频1.45G,拥有260个核心,双精浮点峰值高达3.06TFlops,在双精浮点上完全追平了Intel最好的超算芯片。正是得益于国产众核芯片申威26010的强悍性能,加上良好的体系结构设计以及互联网络等核心部件,使超算拥有异乎寻常的高性能、高效率、低功耗、高性能功耗比和小体积:高性能神威太湖之光双精浮点峰值高达125PFlops,稳定性能为93PFlops,相比较之下,美国超算泰坦的双精浮点峰值高达27 Pflops,稳定性能为17.6 PFlops,天河2号的双精浮点峰值高达54.9Pflops,稳定性能为30.65PFlops,由此可见,&神威太湖之光&在稳定性能是美国超算泰坦的5.2倍(泰坦很可能是美国现在顶尖的超算之一,完成升级的Stampede2性能为18PFlops)。高效率&神威太湖之光&整机效率高达74.16%,相比较之下,美国超算泰坦的整机效率为65.19%,而河2号的整机效率为55.83%,由于超算性能越强,规模越大,整机效率提升就越困难,&神威太湖之光&在稳定性能是美国超算泰坦5.2倍的情况下,整机效率依然大幅优于泰坦,整机效率之高简直令人惊骇!低功耗&神威太湖之光&的功耗为15.3 MW,美国超算泰坦功耗为9MW,天河2号为17.8 MW,可以说,&神威太湖之光&的稳定性能达到天河2号3倍的水平,但整机功耗却低于天河2号。性能功耗比高&神威太湖之光&的性能功耗比高达6G/W,相比之下,TOP500超算榜单上的竞争对手都相形见绌天河2号的整机性能功耗比为1.95G/W,美国泰坦超算的性能功耗比为2.143G/W,美国超算红杉整机性能功耗比为2.069G/W,日本超算&京&整机性能功耗比为0.830/W,美国超算Mira整机性能功耗比为2.069G/W(Mira和红杉用的都是IBM的Power)&&即便是全球Green500排行榜,&神威太湖之光&也能排至第三位。由于Green500排行榜第一和第二的超算只采用了低功耗版的Intel E5,性能非常弱,而即便是采用英伟达K80加速卡的超算,其整机性能功耗比也只有4.7G/W。因此,&神威太湖之光&在性能功耗比上显得格外耀眼。小体积&神威太湖之光&机柜占地605平方米,美国超算泰坦机柜占地面积404平方米,天河2号机柜占地面积720平方米。曾经刷榜的中国超算中国有三大超算系列:天河、神威、曙光。三大系列超算分别由国防科大、曙光公司,以及地处江南的某研究所研制,当然,其中也不乏互相协作以及其他单位参与的情况。近年来,中国超算频频刷榜,不仅赚足了眼球,还为中国国防军工以及社会经济发展产生了促进作用。2009年,中国第一台国产千万亿次超级计算机天河一号在湖南长沙亮相。天河一号超级计算机由国防科大研制,性能为每秒1206万亿次的峰值速度,Linpack实测性能为每秒563.1万亿次,强劲的性能使天河一号位列中国超级计算机前100强之首。2010年,国防科大对天河1号进行了升级,使天河1A的实测运算能力从天河1号的每秒563.1万亿次,提升至2507万亿次,成为当时世界上最快的超级计算机。虽然天河1A使用的是国外芯片14336片Intel Xeon X5670六核处理器,7168片NVIDIA Tesla M2050高性能计算卡,但国防科大在互联网络等方面的技术底蕴颇为不俗。另外,天河1A采用了2048片飞腾 1000八核心处理器。2010年,曙光6000以实测每秒达1271万亿次的Linpack峰值速度,在2010年第35届全球超级计算机500强排名中名列第二。曙光6000由曙光公司研制,和天河1号一样,曙光6000同样是以国外芯片为主,以国产芯片(龙芯)为辅。2012年,神威蓝光超级计算机投入使用。虽然该超算并未冲击TOP500前3名,但作为&神威太湖之光&的上一代产品,神威蓝光超算还是值得一书的。神威蓝光超算使用了8704片申威1600,搭载神威睿思操作系统,虽然超算绝对性能并不高,但却是中国在&市场换技术&之后,首次实现了超算CPU和操作系统的全部国产化。神威蓝光超算峰值计算性能为每秒一千万亿次,持续性能为每秒796万亿次,性能功耗比超过741MFlops/W(百万次浮点运算/秒&瓦),LINPACK效率为74%。神威蓝光超算有两大特点,一是全部使用申威1600芯片,搭载神威睿思操作系统,实现操作系统和CPU全部国产化。二是性能功耗比高。神威蓝光超算性能功耗比超过741MFlops/W。该超算被安装在&国家超级计算济南中心&,主要面向气象气候、海洋环境、生物医药、信息安全、航空航天、材料物理、金融分析、工业设计、石油物探等应用领域。2013年,国防科大成功研制出天河2号,其高达55PFlops的性能使其傲视群雄,六度蝉联TOP500排行榜首位。虽然在计算节点上使用的是美国Intel的CPU,但天河2号也使用了4096片飞腾1500,用于高速互联网络系统。结语虽然&神威太湖之光&在整机性能、整机功耗、整机效率、性能功耗比等重要参数上无与伦比,但也并非尽善尽美,它也有自己的阿克琉斯之踵其内存只有1.31 PB(天河2号为1.4PB)。另外,由于国产众核芯片内存带宽仅有136.51G,而且用的还是DDR3,相比之下,Intel的KNL和英伟达的Tesla都采用3D堆叠内存,内存带宽更是达到512G(Intel PHI) 和 720G(英伟达 Tesla)。因为单个CPU的内存带宽不大,所以对于现实生活中的应用,很难跑出接近峰值的性能。对于某些对内存带宽要求高的应用,实际使用中就不如Tesla和PHI了。不过,这并非申威26010和&神威太湖之光&的硬伤,得益于申威26010异乎寻常的设计理念,使申威26010单芯片能够完成Intel E5+PHI,或Power+Tesla两款产品的功能,而且相对于Intel E5+PHI,或Power+Tesla,申威26010能够实现共享内存,这就避免了Intel E5+PHI,或Power+Tesla必须面对的显式拷贝,从而降低了对内存的压力,并减小了性能损失。笔者猜测,正是因为申威26010异常先进的设计理念,一定程度上弥补了内存上的不足,使中国科研人员敢于采用136.51G的内存方案。虽然有内存上的瑕疵,但瑕不掩瑜在美国的100P超算问世之前(估计要2018年前后),&神威太湖之光&会是全球性能最好的超算。(作者微信公众号:tieliu1988)
(责任编辑:张海潮 CM013)
用微信扫描二维码分享至好友和朋友圈
精彩高清图推荐:

我要回帖

更多关于 神威太湖之光 知乎 的文章

 

随机推荐