神威太湖之光 处理器与天宫二号有什么关系?

问题已关闭
与已有问题相似
问题已重定向至
如何评价神威太湖之光?
已有帐号?
无法登录?
社交帐号登录“神威·太湖之光”取代“天河二号”成为全球最快超算_战舰少女台服吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0可签7级以上的吧50个
本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:82,183贴子:
“神威·太湖之光”取代“天河二号”成为全球最快超算
6月20日电(记者林小春)新一期全球超级计算机500强榜单20日公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超算上榜总数量也有史以来首次超过美国名列第一。  据国际组织当天发布的榜单,“神威太湖之光”的浮点运算速度为每秒9.3亿亿次,不仅速度比第二名“天河二号”快出近两倍,其效率也提高3倍。更重要的是,与“天河二号”使用芯片不一样,“神威太湖之光”使用的是中国自主知识产权的芯片。  该组织在一份声明中写道:“中国在国际组织第47期榜单上保持第一名的位置,凭借的是一个完全基于中国设计、制造处理器而打造的新系统。”  “神威太湖之光”由研制,安装在国家超级计算无锡中心。此前,由中国研制的“天河二号”超级计算机已在榜单上连续六度称雄。  榜单前十名除了“神威太湖之光”与“天河二号”外,其他分别是美国的“泰坦”与“”、日本的“京”、美国的“米拉”和“三一”、的“代恩特峰”、德国的“花尾榛鸡”和的“沙欣II”。  榜单是对全球已安装的超级计算机“排座次”的权威排行榜。从1993年起,由TOP500国际组织以实测计算速度为基准每半年发布一次。  此次榜单还有一个重大变动是,美国入围的超级计算机总数量首次跌下第一位置。上述声明说,由于过去一些年中国工业和研究部门注册提交的系统数量剧增,中国现在入榜的超级计算机数量达到167台,超过美国的165台。此外,由于中国占据TOP榜单头两名,中国在计算性能类别上也居于领先位置。  排行榜主要编撰人、美国计算机学教授杰克·唐加拉评价道,中国超级计算机不断增多已成为一个“趋势”。  “2001年中国上榜数量还是零,但今天中国已经超过美国,”唐加拉对记者说,“没有其他国家有这样快的增长速度。”  唐加拉认为,超级计算机“比以往任何时候都重要”,能为能源、医药、飞机制造、汽车与娱乐业等广泛领域的行业提供高性能计算服务。“更强大的计算能力将使得这些不同行业更快地生产出优异新产品,从而提高一个国家的竞争力”。
第一中国神威 Linpack 93P 功耗15,371KW第二中国天河2 Linpack 33P 功耗17,808KW第三美国泰坦 Linpack 17P 功耗8,209KW 黑功耗可以滚了。 采用“26010”众核处理器, 这个超算的国产具有世界水平,在工艺落后于两代的情况下评测的计算能力和效率达到或超过英特尔下一代众核的水平。 黑芯片也可以滚了。
就是这样!
早就有卖号的想法,临上...
 全球超级计算机500强...
天河主场将升级   “...
@左脸小右脸大
辣鸡,名字真他妈中二。
把神威二字去掉就不中二了   ——骗桶中
自主芯片用在哪部分啊?天河也不是没用自主的
神威 o 太湖之光!
别人躺下时是这样_(:з」∠)_楼主躺下时是这样_(:3」∠?)_吧务躺下时是这样_(:з」∠?)_
独裁郭嘉自己造超算?一定是偷偷买的
秘技:神威!太湖之光其实是芯片叫神威..那个地方在太湖边上...
对学渣宝具
创维OLED-S9D
神威,想起天刀了
申威26010还是比老黄的帕斯卡慢了2TFLOPS啊……还需努力
这中二的名字,tg堕落了
这个名字,还以为是楼盘
这是要放必杀技了么
另外众核处理器对应的应该是Xeon PHI,换句话说这玩意更像GPU……
辣鸡国家,有钱研究这些破东西不如把这些钱用来改善人民的生活呢,人家美国比不过你是人家把资金都用在改善人民的生活了。一条五毛,记得删括号。
是不是起名的大人物其实是中二
土鳖科幻战力破万
神威这名字不是长者钦定的嘛
好大喜功,不关心国计民生,有那钱不如去扶贫山よ,銀河よ,俺の歌を聴け!   --来自巴神的問候
造出这种东西除了劳民伤财还有何用?连圆珠笔的小球和单反都造不出来的破锅吃枣药丸
这名听起来像技能
用了带土之眼?另外上娱乐大师跑个分看看?
我进错吧了?
古代不就有神威大将军炮了这符合基本法
这名字……我笑了
贴吧热议榜
使用签名档&&
保存至快速回贴如何评价神威太湖之光打败天河二号在超算 Top 500 榜单中登顶第一?
在sc16上最新公布的top500榜单中,突然杀出来的纯国产超算神威太湖之光(Sunway TaihuLight)达到了93P的linpack值,登顶榜单第一!并且中国拥有的超算数量首次持平美国!看到回答中有提到神威蓝光和DEC alpha的,印象中alpha是因为内存模型太弱而退出市场的?不知道就太湖之光的架构方面以及跑Linpack以外的实际应用能力,懂行的同学有什么更多的看法呢?intel那种通常架构上跑的应用方便移植吗,移植之后可能的性能情况?愿国内超算的未来更美好!!!
214 个回答
白天看到这个消息非常振奋,当即就去找导师汇报!我:“中国造了一台新超算,100PFlops!”导师的第一反应是:“功耗多少?”我:“15MW”导师:“Holy sh*t!”我:“他们没用 Intel 的芯片。”导师:“oh that makes sense”我也不是黑 Intel,但实在是x86架构的历史包袱太重了,想要实现 性能/功耗比的重大提升,这是一个迈不过去的坎。 我在
这个回答中就提到过,Rex Computing 的人在做的事之一就是砍掉Cache,用 Scratch Pad Memory 取而代之。而在太湖之光的众核架构中的大量 Slave core里面,采用了同样的思路,只保留了instruction cache。data cache用Scratch Pad Memory代替,避免了众核情况下的cache coherence带来的大量性能和功耗浪费。(Master core 里面有正常的Cache),我觉得这是太湖之光实现高性能/功耗比的一个重要原因。 而且Slave core只支持user mode,于是我猜测它在TLB上面应该也有精简。但目前 SW26010 芯片还没有详细的文档资料,所以这点我也只能猜测。至于采用众核架构,可以说是大势所趋,美帝一些新的系统用的也是Intel的众核Knights Landing芯片,据说性能也很不错。至于指令集,Jack Dongarra在他的报告里特意强调和Alpha的指令集没有关系,所以哪怕神威前几代芯片和Alpha 有渊源,但这次应该真没有。。然后更令我惊喜的是不光系统搭起来跑了Linpack,而且还有三项应用入围了Gordon Bell奖的最终名单 (这个算是超算界最厉害的奖了)。充分说明太湖之光已经形成战斗力了啊!最后冷静下来谈一谈不足之处: HPCG的跑分。为什么HPCG跑分重要?因为它比Linpack更接近真实应用的场景,更能体现出内存系统的瓶颈。用一个汽车的比喻来讲,Linpack的跑分更像是汽车的百米加速指标,而HPCG更像是到真实的赛道上去跑——这时候就不光是加大马力就能行的了,操控性等其他因素也很重要。太湖之光在HPCG的测试下只达到了它0.3%的峰值性能,总的算下来还不如天河二号。说明其在 memory 和 network 的性能上存在很大的瓶颈。这其实还是挺不乐观的。最最后还是不要掉以轻心,美帝这边正在奔着exa-scale (1000 Pflops) 努力,计划在2023年拿出性能达到exa-scale,功耗小于20MW 的超算。(美帝目前没有建造类似天河二的系统很大程度上是因为功耗的限制,放眼望去基本都是10MW 以下的) 眼前就有GPU带来的变革,DARPA 为此也投资了不少黑科技的项目, 而且这个新闻一出,估计跟国会要钱更容易了…… 革命尚未成功,同志仍需努力啊!
一个比较详细的测试报告:Top 500排名第1Graph 500排名第2Green 500排名第3,这个排名比较的是 性能/功耗这东西其实倒腾了很久了,和天河二号是同时立项的,目标都是100P。建造单位是国家并行计算机工程中心,属于军队研究单位,所以一直没有对外公布。本来预计是去年底就会发布的,一直拖到了现在。神威系列的产品,其实一直都在部队内部运用,民用的不多,唯一宣传较多的就是济南超算的神威蓝光。获得国家最高科学技术奖的金怡濂院士,就曾经是神威系列的总设计师。相比于机器本身,更值得期待是年底的Gordon Bell奖,这个ACM的Award是颁发给HPC领域的最前沿的应用的,代表着具体系统和实际应用结合的最高水平。中国目前还从未获得过,连入围最终阶段的应用都还没有(去年有个德国的应用在天河2上入围了)。而今年,在神威太湖之光上有2个应用(也有可能是3个)已经入围了11月份的Gordon Bell奖最终评审阶段,如果能够斩获最终的大奖,意义更大。神威太湖之光的CPU架构是自己设计的, 计算单元包括两个部分,一个是主核,和普通的CPU类似。二是8*8的从核阵列。从核阵列相当于是GPU、MIC这一类的加速部件,可以直接访问主存,阵列行列之间可以进行快速的寄存器通信。-----------------------------------------------------------------ps:神威二字可是长者题字哦
嗯,终于有
出手了,这个题目才算有价值的回答。还有
转帖的部分也很有意思。他自己写的部分是车轱辘话不看也罢。超算冲榜,如果靠本国自研制的消费级CPU,不管是自有指令集和架构,还是仿制x86,继承Alpha的遗产,还是复活MIPS,甚至是借力ARM ISA,我个人认为 3-5 年内,都比较难有突破性的作品出现。但是如果做流式的处理器或者是many cores那是有希望的。这一类产品的好处就是可以根据需求,调整控制和计算单元的配比,设计更高效的IO体系。这点我非常同意 Sean 的看法,On-chip local memory因为没有同步问题,协议简单可以针对特定应用,在较少面积较低功耗的情况下,做到很好的Bandwidth/Latency,是超算的一个方向。事实上,以消费级芯片为计算核心的超算设计时间并不长。x86-64主打的Supercomputer是从03年才开始的,IBM现在的Power芯片也都和消费级芯片区别不大。更早之前往往都是大型机的历史。消费级芯片集群占据超算主流,主要是因为,0. 消费级芯片性能的迅速提升1. 这一等级芯片的巨大产量带来的廉价芯片2. 节点上成熟的软件体系3. 节点易于复用但是一旦节点数量增长到一定限度,单芯片性能本身遇到瓶颈的时候,整体功耗和极为复杂的节点互联带来的可扩展性就开始成为了问题。大家都看到这个问题,但是消费级芯片的灵活性和软件的完备性又不是说替代就替代的。有同学认为,支持了 OpenACC 和 OpenMPI 就没有软件问题了,这完全是一厢情愿的美好愿景。在可以预测的将来,超算应该会朝着异构集群的方向发展,在满足灵活性和软件适应性的情况下,对特定应用寻求更高的性能和性能功耗比。现阶段能见到的方案就有(感谢评论栏中 李发 的提醒):同构:京(K Computer)异构:从设备:GPU主-从片内通讯:目前还没见到过,也许以后AMD的hUMA会出超算?主-从片间通讯:天河1,Titan(AMD Opteron + Tesla)从设备:Slave Cores主-从片内通讯:神威,下一代Phi Cores主-从片间通讯:天河2(Xeon + Phi)这些体系各有各的优势。论易用性和软硬件成熟度,同构高于其它,片间通讯又要比片内的主从结构方便一些(这个并不绝对),Many Cores比GPU方便一些。但是可并行的计算密集型应用的话,片内通讯的CPU+GPU最经济。所以神威现在于Linpack上的领先地位,我个人认为更多是来自于代际不同。这是一个非常好的起点,起码以后中美在做Exa级别的架构、互联、应用上已经是同场竞技了,这点从中美两国超算建设的Roadmap上就能看出来。而且做个大胆的预测,除非以后光路计算机得到广泛应用,否则即便是量子计算机出现,超算也不会跳脱现有的异构体系,新体系很可能是未来数十年的基础。但是这个代际之间的转换并不是免费的,牺牲了HPCG换来了Linpack,牺牲了一些Master换来了一大批Slave。这就意味着现有的设计,总是会在一些场景下不如以前。对于神威的军方背景,面临的问题相对单一。以核爆模拟为主的计算,Linpack对他们来说或许是最合适的测试,这一点Gordon Bell提名是个非常有利的支持证据。但是对民用超算而言,场景更加复杂多变。这时应当能见到很多来自于Master的瓶颈。所以要想有更加强力的民用超算,消费级/通用 CPU 还有待继续发展。而天河和神威,也应该是一对互补的超算系统,分别适用于不同的应用场景,在各自的领域他们都是最顶级的计算设备。撇开场景直接将指标相比较,是不太合适的。
昨天早上在新闻上看到此消息,非常感动。私以为这是与“两弹一星”同等级的事件。本以为美分喷子们应该找不出喷点,结果喷子的数量、质量和智商突破我的想像力,基本上都不去求证相关消息,甚至连新闻原文都没看完,看标题就开喷。所以我来搬运一点的原始内容。下图是超算是逐年统计。从2013年起,中国一直是第一名,之前天河2六连冠,现在开始神威太湖之光将会在第一名位置待上一段时间。 无论在美国网友还是中国网友看来,未来中国的超算将继续保持在下图的褚色线上若干年(文后有图为证)。当前超算各国份额:以超算速率做为面积比重,分国家做出来的图,黄色部分为中国,红色是美国,然后是其它国家。以内核数量做为面积比重,分国家做出来的图,黄色部分为中国,红色是美国。以下三个方图(TreeMap)的面积比例都是根据超算速率(Rmax)来画的——如果按照峰值速率(Rpeak)或者内核数量(Cores)的话,太湖之光占比会更高。一颗CPU里面有260核,听着都吓人。作为外行,不知道功耗为啥还那么低。 从以上的四个图上看,现在神威所使用的架构是小众,或者是极小众的东西,但是在超算方面的能量却是巨大的;前三张图能看出来申威的CPU功能强大,却只此一家用,所以最重要开拓市场,大卖大卖。从以上的四个图上看,现在神威所使用的架构是小众,或者是极小众的东西,但是在超算方面的能量却是巨大的;前三张图能看出来申威的CPU功能强大,却只此一家用,所以最重要开拓市场,大卖大卖。接起来当有国际买家想买超算的时候,申威的CPU和神威的超算结构将是买家一定会考虑的选项。虽然可能在软件支持方面可能略有短板,但作为一流超算做复杂配置是免不了的,而且随着市场变大,软件支持会快速增长。最后再YY几句,以这些中国的习惯,只要是中国人看上的东西,很快会变成白菜价。这种众核CPU会在中国工程师的努力下成白菜价,让全世界的人民都用得上便宜实惠的超算系统——以后就让美国政府自己买又贵又吃电的X86去吧。咱们要努力让每个中国大学都用得上超算——比如没超算资源就不许开物理学、数学、天文学、核能、水文学、气象学,航空动力专业。 不同地区的大学应该以股份形式建立地区性的超算中心。补充一点:1 有人说“美国一禁运,中国就突破”,“感谢美国禁运之恩”。 当然我同意美国的禁运无法遏制中国的科技发展,但是这些话传着传着传出了这么一种味道“如果不是因为美国的禁运,中国人不会争气去突破技术难关”。 据现有我所看到的资料说,申威CPU的研发早在几十年前已经开始了。 如果说因为2015年4月美国超算CPU的禁运之后,政府才觉醒要自强,怕是到2016年6月根本连队伍都建立不起来。 而且根据某个报道说,在美国禁运CPU之时,科研方已经研发好了,只因时机未到还处于保密状态。2 说神威名字难听的,请读读下面的这些诗词,每行都出自不同的诗词。:将军逐马关中来,神威掠地风云摧(宋末元初·金涓)倒卷黄河,风浪涌神威 江梅引(元·王吉昌)神威烈,把黄河倒卷,白浪翻空 沁园春 龙(元·王玠)通玄妙,看余家手段,别有神威
沁园春(元·侯善渊) 吾作变通力,要之出神威仗雷电神威,风云圣算,何往无成。 木兰花慢(元·胡祗遹)神威清北塞,王气接南京(明·程通)六龙飞天天下睹,皇度神威谁敢侮(明·韩雍)洒墨起云端,神威耸众观倚天长剑,凛凛神威张我虎神威,何难驱群羊神威欲挟雷霆下,大业常同江汉流。别具神威临异域,不教正统擅中华渐酒醒人远,要凭寒剑,把神威借(近现代·龙榆生)。
分割线后是外国网站上的一点内容
6/22补充一点近些天来外国媒体和网友的表现。我的翻译只是个大概意思,为了气氛加了点个人创作,大意没错——错的严重就指出来我改。Twitter几个媒体,都是简单一句话,没提我们自主芯片的事儿。INTEL只提它自己。 根据top500的数据,仅太湖之光就占了16%的system power,intel说自己占了91%是怎么来的? 即使不算IBM和神威蓝光,你最多也只有84%啊。 也许你选择了intel特殊算法。能扫雷吗? 原来处处有这样的人。《连线》(Wired)华尔街日报华尔街日报跟着看看华尔街日报上网友的评论。跟着看看华尔街日报上网友的评论。看下图David的评论,我看看哪个喷子再说“美国已经不玩这个了”?看下图David的评论,我看看哪个喷子再说“美国已经不玩这个了”?感谢感谢纠正了翻译的错误。-----------------------------------------------要说洋喷子和洋脑残,数facebook上较多——比例和微博差不多,但也不全是喷子。上面那句“我虽不懂XXX,但我懂中国”,是句名言呐,有兴趣的乎友去搜搜,或者谁给个链接。 不过人家Eric的原话是说“我虽技术盲,但我在中国待过段时间”。上面那句“我虽不懂XXX,但我懂中国”,是句名言呐,有兴趣的乎友去搜搜,或者谁给个链接。 不过人家Eric的原话是说“我虽技术盲,但我在中国待过段时间”。最后这个Vladimir Munoz,九成是美国新移民,这种现象其实很普遍,新移民总比旧居民更迷信他“投资”的新国家/地区。 知道凤凰的某闾,某在日本吗?知道香港闹腾的都什么货吗?感谢纠正了翻译的错误。-----------------------------------------------不确定还有没有空更新更多。先更到这儿。------------------------------------------------------------------------------------------想转载新自便,最好标识来处,也告诉我去处。------------------------------------------------------------------------------------------
w作为前HPC从业只能说江南所很强,用落后两代的工艺造出跟英特尔下代众核相当的产品,还比英特尔先投入应用修改:看到楼下貌似喷子回复出现,特此针对喷点补充一下:1)中国无论天河-1还是天河-2现在都是满负荷运转,根本没有闲置问题,天河1不说了,现在用得排队,天河2的国防科大自己想测试下节点都经常没资源,所谓天河-2上利用效率不高也是相对于去目的的,把资源满负荷当然容易,以前跟袁学峰教授合作过,这么说吧,人家所谓利用不充分是说重大科研课题放在天河-2上的没他们期望的比例高,至于金融类动漫类低层次的应用,人家根本没把它们当正经应用(这类应用由于门槛低,并行度高,很容易占用大量计算资源),国防科大和广州天河的袁教授期望的是天河-2在国家重大专项等高层次应用上更多做出贡献,比如核物理,流体力学等代表超算顶尖水平的应用更多(这也是天河-3继续获得国家拨款的主要依据,国家一点都不傻),这当然有一定难度,因为天河-2是异构计算机,想充分利用这些资源,代码几乎都得重写,实际上,在美国TITAN上由于用了GPU, 这类应用推进的也不怎么样。2)以我在HPC工作接触的情况来看,江南所这个超算完全不用担心上述问题,因为江南所是军方背景,他们搞得计算机一个主要应用就是核物理仿真,中国在核物理仿真方面几乎全部代码都是自主搞得,而且很多代码都是针对江南所的计算硬件专门设计的,编译器加速库等生态系统一应俱全,因此这些在天河-2上遇到的问题,反而在神威上可能不是太大问题,一个例子就是神威超算刚上线,一个核物理仿真在神威上就取得了40P的惊人效率,并且有三个应用已经入围超算应用国际大奖评选了(效率3占到理论峰值多30%的超算应用是惊人的,实际上写过程序的都知道,别说超算,即便多核计算机,一般的应用能达到系统浮点峰值30%都是挺不错了)。当然相应的,神威上部署民用应用,比如金融/动漫渲染之类低层次应用,反而难度会大一些,基本上代码得重写或者大改,但是对这种层次的超算,这些低水平应用本来就不是重点。3)有个号称做HPC的从业者在本贴居然吐槽这超算是浪费钱,不如把它拆成工作站给大家?说这话还号称自己搞过超算,是民科超算吗?对很多核物理和流体,计算电磁学等高端计算来讲,现在超算不是能力太强,是太弱,因此只能千方百计地降低计算复杂度+各种简化,实际上即便是天河-2,做流体的直接数值模拟,也根本达不到可用的尺度,这里居然“超算从业人员”吐槽超算没用不如工作站,他搞的超算应用是“算盘”的算吗?
alpha可以瞑目了。其实,这个东西很久了当时是compaq收dec,hp收compaq,然后alpha就重金卖给中国了。没有民用,江南所拿到其实前几年,济南有个神威蓝光的超算,性能功耗比就很牛了,我当时还专门写过一个文。众核架构是当年alpha预留了,人家早就考虑到众核的通讯问题。alpha当年真是一朵奇葩。amd的ev7,intel的超线程都是当年alpha的遗产,遗产到现在,中国这边还搞出来后续。
日前,“神威太湖之光”取代“天河二号”登上全球超级计算机500强榜单之首,就在国人为此而自豪和骄傲之时,一些不和谐的音符也随之而来——有人认为“神威太湖之光”劳民伤财是形象工程;有人认为,“中国的超算硬件硬,软件却很软,跟不上要求,像天河超算的资源就大量闲置,将来神威也会一样闲置”;还有人认为申威26010存在设计缺陷,或忙着给申威26010“找爹”......但事实上,这些对“神威太湖之光”的抨击,本质上和当年“天河二号”荣登全球超级计算机500强榜单第一位之时,一些社会舆论攻击“天河二号”因使用美国Intel的CPU,是组装货,进而不具备技术含量如出一辙。文︱瞭望智库特约科技观察员铁流本文为瞭望智库特约文章,如需转载请在文前注明来源瞭望智库(zhczyj)及作者信息,否则将严格追究法律责任1所谓“软件软”造成超算闲置是伪命题超算所运行的软件可以分为系统软件、基础软件和应用软件。像系统软件(包括操作系统,集群管理调度系统等),HPC基础软件(并行环境,数学函数库等),这些软件以开源软件为主,由于开源软件性能相对偏低,需要针对国产机器特点进行定制开发和优化,所以国内超算大多数是以开源软件进行定制,比如天河超算的操作系统就是Linux的定制版本,2012年投入运行的神威蓝光超算采用的是神威睿思操作系统,神威睿思操作系统其实也是Linux的定制版本。至于开源软件中,中国程序员的代码贡献比例,那就是另外一个话题了,笔者在《9座大山压着,这个关乎国家安全的命脉一直被别人抓在手里》一文中已有详细阐述,本文不再复述。而应用软件中,既有开源软件,比如用于量子力学的Quantum ESPRESSO、Octopus、ABINIT、CP2K,用于分子动力学的ESPResSOmd、LAMMPS,用于离散格子玻尔兹曼方法的OpenLB......也有商业软件,比如计算流体力学的ANSYS Fluent、ANSYS CFX、Xflow,用于模拟安全碰撞、跌落的LS-DYNA、MSC Nastran (SOL700)、Radioss......在形形色色的应用软件中,工程仿真领域以商业软件多,而且这当中大多是国外软件,这些国外软件不仅价格特别昂贵,而且并行规模受限,有些模块国外是禁运的,有些可以用于军工的软件也严禁出售给中国。笔者做一个总结,中国超算的系统软件、基础软件大多基于开源软件定制,因为是开源软件,而且国内科研单位还进行了修改,完全满足超算的使用需求,也就不存在因为软件水平落后而导致超算闲置的问题。而在应用软件方面,虽然很多商业软件被国外垄断,而且价格昂贵,确实影响了中国超算的应用,但却并非无软件可用。实际上,造成超算计算资源闲置的主要原因是全机计算比较少,鲜有一个大应用占全部资源的情况,以及国家没有给足够运行经费,因而收费贵,很多用户用不起。2天河超算资源闲置与客观事实不符目前,无论是“天河一号”还是“天河二号”都不存在运算资源闲置的问题——早在2016年1月,新华社就报道过《中国超级计算机“天河一号”满负荷运行》,文章中称,“天河一号”目前已经处于一个满负荷,甚至是超负荷运行的状态,每天在线运行任务超过1400多项,这是欧美国家级超算中心都很难达到的一个业务规模......截至目前,天津超算中心已经给全国100多家重要企业提供服务或是形成了深入的合作,阶段性地实现节省企业研发投入上亿元,为企业带来相关经济效益超过20亿元。不仅“天河一号”处于满负荷状态,“天河二号”的大规模计算资源也不容易申请,必须排队,就连国防科大自己想测试下节点都经常没资源,所谓“天河二号”上利用效率不高也是相对于曾经规划的目的而言的——在原本的计划中,希望将更多的诸如核物理、流体力学等代表超算顶尖水平重大科研课题放在“天河二号”上,但后来在实践中,这个比例比原本计划的低;像金融分析、动漫渲染这类门槛相对偏低的应用,并行度高,很容易占用大量计算资源,因而在计划中没有被看得“比较轻”,没有被列入计划所希望的应用列表中。另外,就客观规律而言,超算使用率是不可能达到100%的——跑计算密集型计算网络会有利用不充分的情况,跑通讯密集型计算处理器也会利用不充分,然后大量计算因为处理问题的特点不能做到负载均衡,加上超算上大多同时跑非常多任务,所以整体来看总是有计算资源空着,虽然在旁观者看来计算资源没有跑满,但其实写代码的人已经在恨计算资源不够了——这也解释了为什么明明现有超算的计算资源没有跑满,全世界却都在追求性能更强的超算。3真正的要害在于编译器和接口在PC领域,软件生态对自主CPU的商业化推广造成了很大的障碍——龙芯跑不了Windows,和现有的Witnel体系不兼容,因而被扼制。但有些人却将PC领域的情况套用到超算中,认为“神威太湖之光”超算采用了自主众核芯片申威26010就会像龙芯在PC领域一样遭遇生态问题,这其实完全是外行人的杞人忧天——由于“神威太湖之光”建设单位的特殊背景,“神威太湖之光”的主要应用方向基本上是应对特殊领域,而在这些特殊领域,相关的软件代码基本上都是自主开发的,且很多代码都是针对申威进行专门的优化。而且在软件上,编译器加速库等生态系统一应俱全,因此,根本不可能遭遇龙芯在PC领域碰到的软件生态难题。诚然,在民用应用方面,比如金融分析、动漫渲染之类低层次应用,“神威太湖之光”如果要跑这些应用,代码确实要重写或者修改,但对于超算用户来说,其实难度并不大,很多用户自己就能搞定——超算中心只要提供编译器、MPI、任务管理系统、登录系统、文件管理系统就足够了。对于大超算而言,任务管理系统,登录系统,文件管理系统可能要自己定制,甚至是自主开发,不过这些难度并不算大,比如天河二号就是用的自主的MPI和文件系统。很多用户只用超算上原配的GCC、MPI、SSH、PBS,如果要用别的软件,需要用什么,用户自己安装什么,甚至是自己编写,并不需要超算建设和运营者自己劳心费力——只要有了MPI、openmp、cuda和openacc等接口和编译器,科研人员和超算用户可以根据机器的手册编好代码——既可以自己从零开始编写,也可以在通用代码包的基础上修改,大部分情况下没问题。除非遇到存在非定义行为的情况,或是有汇编优化的情况,以及编译不规范的情况——有些新手编程不规范,同样的代码在不同编译器下会跑出不同结果,使用SWCC编译器得出一个结果,使用GCC编译器得出另一个结果......遇到这种情况只能怪程序员代码写得不规范了。总而言之,超算只提供基本的计算环境,只需提供编译器和并行接口就满足几乎所有超算应用的需要了——因为并行接口是开放的,大家都是用的统一标准,所以根本就没有软件落后这一说法,所谓软件落后而导致超算计算资源闲置更是无从谈起。4天河超算曾经遭遇软件问题的根源当今超算的计算节点要么采用CPU+加速器的方式,要么完全采用相同的CPU。采用CPU+加速器的方式,被称为异构计算。举例来说,以美国泰坦和中国天河2号为例,泰坦有18688个运算节点,每个运算节点由1个16核心AMD Opteron 6274处理器和1个NVIDIA Tesla K20加速器组成,共计299008个运算核心;天河2号有16000个计算节点,每个节点由2片Intel的E5 2692和3片Xeon PHI组成,共使用了32000片Intel的E5 片Xeon PHI;天河1A使用了14336片Intel Xeon X5670处理器和7168片NVIDIA Tesla M2050高性能计算卡。这些超算的计算节点都采用了CPU+加速器的方式,因而都是采用异构计算超算的典型代表。而完全使用同一块CPU则被称为同构计算。比如,日本超算“京”只采用了富士通制造的SPARC64 VIIIfx处理器,神威蓝光只采用了8704片申威1600,IBM的Mira和Sequoia,就只采用了PowerPC A2处理器,这些都没有采用GPU或众核芯片等加速器。由于在过去,超算大多采用同构计算,因此所有代码都是根据同构计算编写的,而近年来,由于采用异构计算可以获得非常高的性能和性能功耗比,越来越多的超算采用了异构计算方案,这使得过去曾经能用于同构计算的代码无法在采用异构计算的超算上稳定运行,所有代码都必须修改甚至重写(同构超算跑openmp,异构超算跑cuda和openacc),而在“天河一号”、“天河二号”降生之初,就遭遇这个问题,但随着时间的流逝,越来越多的代码完成了移植,天河超算曾经遭遇的软件问题自然迎刃而解。5内存偏小并非申威26010的设计缺陷上文提到过采用CPU+加速器的方式为异构计算,只采用一种CPU则为同构计算。但申威26010则显得比较特殊,如果用相同类型指令集和体系架构的计算单元组成系统的计算方式来定义同构计算,那么,由于神威太湖之光只采用了申威26010,而且运算核心和管理核心的指令集都相同,也许会被认为是同构计算。但实际上,神威太湖之光双精浮点峰值高达125PFlops,稳定性能为93PFlops,确实是采用加速器才取得的高性能——本质上,申威26010是将CPU和加速器合二为一——申威2个核心分为2种,一种是管理核心,发挥类似CPU的功能,另一种是运算核心,发挥类似加速器的作用,这就使申威26010单芯片能够完成Intel E5+PHI,或Power+Tesla两款产品的功能。而且相对于Intel E5+PHI,或Power+Tesla,申威26010能够实现共享内存,这就避免了Intel E5+PHI,或Power+Tesla必须面对的显式拷贝,从而降低了对内存的压力,并减小了性能损失。想必也是如此,申威26010的缓存和内存都显得偏小,因为访存模型可能非常单纯——等于是放弃现有cpu的复杂内存管理模型,把内存调度的任务完全交给开发者,只在CPU支持一个最简单的访存模型,在硬件上没有cache的硬件一致性要求(Intel KNL将Cache一致性交由硬件负责),将同步的工作交给软件。这种异乎寻常的设计使得申威26010在拥有高性能和低功耗的同时,弥补了自身在内存上的短板。6不要给申威“找爹”神威太湖之光使用了上海高性能集成电路设计中心设计的国产众核芯片申威26010,该众核芯片主频1.45G,拥有260个核心,双精浮点峰值高达3.06TFlops,在双精浮点上完全追平了Intel最好的超算芯片。正是得益于国产众核芯片申威26010的强悍性能,加上良好的体系结构设计以及互联网络等核心部件,使超算拥有异乎寻常性能指标。每当中国取得技术突破之时,网络上总会冒出一群“找爹党”,本次神威太湖之光超算刷榜也不例外——一些人声称申威26010使用了ARM指令集,一些人将申威26010与 DEC的Alpha联系起来,并将其“认爹”。就事论事来说,申威和ARM完全没有任何关系,在中国获得ARM指令集授权的只有华为海思和国防科大。不过,申威与Alpha却有一定渊源,但血缘关系非常淡薄,稀薄到可以忽略不计,和DEC当年的Alpha已经完全是两回事了(毕竟DEC被康柏收购已经快18年了),有人称之为类Alpha自主指令集,笔者联系过申威的科研人员,他明确表示是自主研发的申威-64自主指令集,相关单位也明确表示与DEC的Alpha无关。请广大网友不要给申威“找爹”,何况这个“爹”已经挂了18年了。7超算性能永远不会过剩在CPU、操作系统、互联网络等核心部件全名自主化后,一些人以“超算性能过剩论”来指责神威太湖之光超算性能过剩,是面子工程,根本无用。对于“超算性能过剩论”,笔者认为,对性能的追求是永远不会停止的,计算用的代码是可以修改计算精度的,如果有更好的计算条件用户自然会提高网格密度或粒子数目,稍加修改就使计算精度提高了,高的精度可以用来解决更深一层的问题。所以做性能多高的超算都不会性能过剩,做超算从没有够用的说法。正如奥林匹克格言“更快、更高、更强”,超算同样只有不断追求更快。
神威牛逼!另外不要说美国不造超算了。美国一面对中国实施相关芯片的禁运,另一面能源部下属的三个国家实验室都有下一代超算正在开发,设计目标都比神威要高,一台150Petaflops,一台180 Petaflops,一台200 Petaflops,2018上线,这还不包括德国、日本等国家的100P及以上的超算计划。希望江南计算所和国防科大的同行们守住啊!继续加油!
国产超算、国产CPU、国产OS,并称中国计算机爱好者三大宗教问题。宗教问题不适合从技术上讨论。----分割线----
我现在在IBM T. J. Watson Research Center 实习,今天mentor给我转发了相关的新闻和评测报告,所以下班回来干脆认真回答一下。
14年或者15年的时候,我曾经在北大生科听过一场讲座,讲座主讲人包括生科的饶毅教授,饶毅教授在那场讲座有个一段这样的发言(第一人称转述大意,具体文字不记得了):
“新闻媒体,甚至是中小学的教科书中很多科普信息都是假的,因为民众的知识水平不足以了解真正的前沿科学的内容,因此’编造’一些通俗易懂的科普信息就是一个非常好的选择。比如’太空种子’,从来没有哪个国家真的把种子送上太空然后拿回来种植之后,就获得了比以前非常好的性状。可是为了让大家明白太空探索的重要意义,’太空种子’就这样被编造出来了。”
事实上,每隔一段时间就要把计算机界“颠覆”一次的国产OS、CPU、超算也是如此。别的学科不谈,中国的计算机界从软件到硬件,每一年都会取得很多巨大的进步,至少中国的计算机水平是和世界第二大经济体的身份相匹配的。但是这么多进步,舆论却往往只关注几个“跑分王”,关注的原因无非是他们成功地和“核武器”、“国家安全”等事关“民族自尊心”的大事联系起来了。当然,不能透露姓名的倪院士和张院士等人的“吹X”能力也是功不可没。
北大众志项目的负责人程旭教授在给研究生开的计算机体系结构课上曾经讲过大概这么一段话:
“处理器的发展史上出现过很多划时代意义的产品,其中很多产品在出现几十年后,设计思路仍然在发生着重要的影响。但是产品跑分再好、理念再新,走出象牙塔之后如果无法在市场上站稳脚跟,很快就会消失, MIPS、Alpha都是如此。”
不管是国产OS、国产CPU、国产超算,其实都是一个道理。OS/CPU这些关系整个IT产业命脉的行业,随便哪个细分领域,至少都是几个billion级别的市场。巨大的市场份额也就意味着巨大的研发投入,不管是一个公司还是一个国家,想要长期在一个领域站稳脚跟,单单是靠投入而没有产出,恐怕不太现实。跑分这个东西,在实验室中再好看,如果没法获得市场的认可,没法带来实实在在的经济价值,也没有任何用处。
具体到今天大家热议的“神威-太湖之光”这台超算,我只能说“我国已经在计算机体系结构领域培养了相当一群优秀的人才,我国在这方面的整体实力已经在世界前列“,但是距离取得商业上得成功、真正让中国的芯片产业能够细水长流,还有很场的路要走。我个人觉得中国的芯片制造、设计能力,落后世界先进水平8~10年的样子,想要有比较大得突破、在市场上获得承认,恐怕不是一朝一夕能完成的事情。但是我们可以看到,至少我们已经有了一大批合格的工程师,和一些已经在国际上露头露脸的实验室,在一些小得领域,已经有了一些赶上的苗头。
说了这么多,今天的seminar到底有没有free pizza?
你们搞得这个电脑啊excited
已有帐号?
无法登录?
社交帐号登录

我要回帖

更多关于 神威太湖之光 处理器 的文章

 

随机推荐