《电子技术应用》
您所在的位置:首页 > 可编程逻辑 > 业界动态 > 美国重夺全球超算霸主,总算力56%来自GPU

美国重夺全球超算霸主,总算力56%来自GPU

2018-07-02
关键词: 全球超算 GPU

  TOP500是针对全球已知最强大的计算机系统做出排名与详细介绍的项目。此项目始于1993年,今年已经是第25年。TOP500每年公布两次最新的超级计算机排名,一次是在6月份的国际超级计算机大会(ISC),第二次则是在11月份的全球超级计算大会(SC)。

  近日举行的ISC会议上,最新一期Top500榜单公布了。这次,榜单顶部的排名变化较大,美国Summit超级计算机摘得桂冠,两个新系统进入前5。这是自2012年11月以来,美国第一次宣布全球最强大超级计算机,重夺超算霸主地位。

1.jpg

  Summit超级计算机。来源:橡树岭国家实验室

  由IBM总包设计建设,目前在美国能源部(DOE)的橡树岭国家实验室(ORNL)运行的Summit超级计算机,在作为TOP500榜单基准的高性能Linpack(HPL)基准测试中以122.3 petaflops(每秒12.23亿亿次)的性能问鼎榜首。Summit超算有4356个节点,每个节点配备2颗22核的Power9 CPU和6颗NVIDIA Tesla V100 GPU。节点与Mellanox双轨EDR InfiniBand网络连接在一起。

  Summit的Linpack测试的理论峰值性能是187.7 petaflops。在Linpack测试中,Summit超算提供122.3 petaflops的性能,计算效率达到65.2% ——这对新机器来说并不差,而且显然会随着时间的推移而改善。

  排名第二的是中国的神威·太湖之光,由国家并行计算机工程技术研究中心(NRCPC)开发,安装在国家超级计算无锡中心。该系统在过去两年里一直名列榜首,自2016年6月上线以来,它的HPL成绩一直保持不变,为93 petaflops。神威·太湖之光在Linpack性能测试中的计算效率达到74.2%,达到93 petaflops的性能的功耗为15.37百万瓦(megawatts),而Summit系统达到122.3 petaflops性能的功耗仅8.81百万瓦。

  美国能源部劳伦斯利弗莫尔国家实验室的新系统Sierra排名第三,它的HPL性能是71.6 petaflops。同样由IBM打造的Sierra超算的架构与Summit非常相似,有4320个节点,每个节点均由两颗Power9 CPU和四颗NVIDIA Tesla V100 GPU驱动,并使用相同的Mellanox EDR InfiniBand作为系统互连。

  天河二号尽管经过了一次重大升级,用定制的Matrix-2000协处理器取代了5年前的Xeon Phi加速器,但它还是下降了两名,由6个月前的第二名变成第四名。天河二号的新硬件将其HPL性能从33.9 petaflops提高到61.4 petaflops,同时将功耗略微提高了约4%。天河二号由中国国防科技大学(NUDT)开发,部署在国家超级计算广州中心。

  AI Bridging Cloud Infrastructure (ABCI)是排名第五的系统,由日本富士通公司制造,它的HPL性能达到19.9 petaflops。ABCI由20核的Xeon Gold处理器和NVIDIA Tesla V100 GPU驱动,安装在日本国家先进工业科学技术研究所(AIST)。

  瑞士的Piz Daint (19.6 petaflops)、美国的Titan (17.6 petaflops)、美国的Sequoia (17.2 petaflops)、美国的Trinity (14.1 petaflops),和美国的 Cori (14.0 petaflops) 分别排第6位至第10位。

2.jpg

  TOP500的前10名

  TOP500榜单中国超算数量超过美国

  接下来我们看看TOP500的一些关键概况。

3.jpg

  尽管美国在榜单上的排名靠前,但目前美国在榜单上的系统只有124套,创历史新低。就在6个月前,美国在榜单上的系统还有145套。与此同时,中国进入榜单的系统达到206套,占比41%,6个月前是202套。接着是日本,有36套系统,英国22套,德国21套,法国18套。这些数字与上次的榜单基本相同。

4.jpg

  国家超算数量年度变化

  不过,主要归功于Summit和Sierra,美国在性能方面从中国手中夺回了领先地位。目前,美国的系统占TOP500系统性能总和的38.2%,中国排在第二位,占29.1%。

  今年是第一次TOP500榜单的所有500套系统的总性能超过百亿亿次级别(exaflop),确切地说,已经达到1.22 exaflops。这比去年11月时的 845 petaflops 要高。其中,有273套系统的HPL性能超过1 petaflops,而上次的榜单超过只有181套系统性能超过1 petaflops。

  CPU架构Intel Xeon占主导地位,56%的计算来自GPU

  就处理器架构而言,Intel Xeon在CPU架构方面占据主导地位。

5.jpg

  未来几年,IBM和AMD可能会分别凭借Power和Epyc处理器迎来复兴,而Arm服务器芯片也将从中分得一杯羹。但即便如此,Intel Xeon仍将继续在CPU方面占据主导地位。

  在加速器方面,TOP500系统中有110个使用加速器,相比2017年11月时的101个加速系统略有增加。TOP500超算的总体性能有一半来自某种形式的加速系统。这些使用加速器的系统中有96个使用NVIDIA GPU,其中前10名就有5个:Summit,Sierra,ABCI,Piz Daint和Titan。此外,使用加速器的系统中有7个配备了Xeon Phi协处理器,而PEZY加速器被用在4个系统中。另外20个系统使用Xeon Phi作为主处理器。

  TOP500的几乎所有超级计算机(97.8%)都由拥有8个或更多内核的主处理器驱动,超过一半(53.2%)的主处理器有超过16个内核。

  10G或更快的以太网在247个系统中被使用,比6个月前榜单的228个多。此外,139个系统使用InfiniBand,比上次榜单的163个少。有38个系统使用英特尔的Omni-Path技术,上次的榜单是35个。

6.jpg

  TOP500榜单中,56%的计算来自GPU。越来越多的厂商开始谈论“人工智能超级计算机”(AI supercomputers),因为可以加速传统HPC工作负载的CPU-GPU混合架构也可以用于机器学习训练。

  自1993年以来,TOP500的总性能、排名第一以及排名500的超算性能变化如下图所示:

7.jpg

  另一个变化是,榜单中学术、机密和研究类型的超算有所减少,而用于工业的超算比例增加了:

8.jpg

  以下是按系统份额的厂商排名,联系有122套系统上榜,占23.8%,其次是HPE,15.8%(79套系统),浪潮,13.6%(68套系统),Cray, 11.2%(56套系统),曙光, 11%(55套系统)。

9.jpg

  尽管IBM拥有前三名超级计算机中的两款:Summit和Sierra,但它在整个榜单中只有19套系统。然而,由于这两台机器,IBM贡献了TOP500总性能的19.9%。接着是Cray,性能份额为16.5%,联想为12.0%,HPE为9.9%。

  Green500榜单

  最后,我们看一下Green500的榜单。Green500中排名前三的超算都来自日本,它们基于ZettaScaler-2.2架构,使用PEZY-SC2加速器。而前10名中的其他系统都使用NVIDIA GPU。

  最高能效的超级计算机仍然日本理研的Shoubu(菖蒲) system B,能效为18.4 gigaflops/watt,在TOP500榜单中排名第362位。

  能效排名第二的是位於日本高能加速器研究组织/KEK的Suiren2系统,达到16.8 gigaflops/watt,在TOP500榜单中排名第388位。

  Green500的第三名是美国的DGX SaturnV Volta系统,接着是Summit(美国),TSUBAME 3.0(日本),AIST AI Cloud(日本),AI Bridging Cloud Infrastructure(日本),new IBM MareNostrum P9 cluster(西班牙),DOE’s Summit system(美国),以及Wilkes-2(英国)。

  作为不依赖任何加速器的最高能效的超级计算机,神威·太湖之光在Green500榜单上排第22位。


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。