《电子技术应用》
您所在的位置:首页 > 模拟设计 > 业界动态 > 华为TaiShan服务器,高性能计算的“新引擎”

华为TaiShan服务器,高性能计算的“新引擎”

2019-04-29

28154842957444.jpg

计算思维的提出,最早可以追溯到1996年麻省理工学院的Seymour Papert教授,而真正将之推到前台,并且自此备受业界关注的,则是卡内基梅隆大学的周以真教授,她对计算思维做出了严谨缜密的定义。

即:计算思维(Computational Thinking)是运用计算机科学的基础概念进行问题求解、系统设计以及人类行为理解等,涵盖了计算机科学之广度的一系列思维活动。

人类当前面临的计算场景,主要集中在大数据、分布式存储、数据库、人工智能等应用领域。不难想象,只要拥有足够强大的算力,困扰人类的诸多难题终将得到破解。

我们知道,至少目前在这个星球上,超算仍是各种IT技术的集大成者,意味着人类计算的最强战力。

多元化的计算时代

对于超算产业来说,2018年的全球HPC TOP 500榜单(上下半年各发布了一次),尤其值得玩味。

中美在超算领域的比拼已经持续多年,虽然美国借Summit的威力重新回到榜首,但是中国厂商却以多出一倍的成绩(229套vs109套),占据了近乎半壁江山的榜单,显示出中国超算的无尽动能与潜力。

除去这些不说,假如细心或是耐心的话,将排行榜拉到204位,我们会看到一台名为Astra的超算系统,它的Linpack排名为1.5 petaflops,距离榜单的头部玩家们仍有一定差距,不过它的不同在于,这是世界上第一台由Arm微处理器驱动的petascale超级计算机。

在人们的传统记忆中,ARM主要是驻扎在手机或是移动设备上面。不过最近几年,ARM已经开始向笔记本电脑,乃至服务器处理器的方向发力,因此最终走向高性能计算也必然是板上钉钉,只不过我们没有想到它的入局如此之快。

星星之火,尚可以燎原,更何况在今年1月的中国南方城市深圳,华为重磅推出了一款自主研发设计的、基于ARM架构的鲲鹏920芯片,具备业界顶尖的7nm制程、最高64内核,并集成8通道DDR4和100G RoCE以太网卡……

这款目前业界最高性能的ARM架构处理器,它的指向不言而喻。

在4月26日杭州举行的华为智能计算大会上,面向大数据、分布式存储、ARM原生、高性能计算和数据库等应用领域,华为发布了TaiShan服务器(基于鲲鹏920芯片)的五大解决方案,为客户带来新一轮的算力加持。

华为中国智能计算业务部总裁万志表示,应用场景的多样性带来数据的多样性,没有一个单一的计算架构能够满足所有场景、所有数据类型的处理。多种计算架构并存是未来计算的发展之路。华为在计算芯片领域15年持续研发投入,构筑了华为智能计算的核心价值。

28154842915449.jpg

华为并非是自说自话,世界正在迎来一个以数据为中心、更加多元化的计算时代。在今年3月的一次媒体活动中,英特尔相关高管也坦称,“任何单一的因素,都不足以满足多元化的计算需求。”

智能计算,用“芯”之作

此前多年,ARM处理器一直致力于成为云数据中心,乃至关系到国计民生的高性能计算的重要组成部分。然而一直步履阑珊,表现也不尽如人意。

我们知道,ARM处理器的特点是低功耗和低成本,这种显而易见的特性使得它赢得了手机以及各种手持和轻便设备的青睐,毕竟这些产品的应用对算力的需求并不是非常迫切。

然而高性能计算则不同,从起初被主要用于密码学、气象学,到后来延伸至金融、勘探、海洋、核能、电子商务、交通、人工智能、工业制造等领域,无一例外均是“重计算”的应用领域。

由于ARM处理器过多考虑功耗的层面,早年间无法在效能表现上满足应用场景的极致计算需求,因此在市场上总是叫好不叫座。显然,ARM处理器必须在功耗和效能之间,取得更高的平衡,方能打开局面,开启新的时代。

28154843257527.jpg

华为智能计算TaiShan&Atlas领域总裁张熙伟表示,作为华为智能计算的最用“芯”之作,TaiShan ARM服务器是是华为在芯片和计算领域长期投资和技术积累的结晶,将为客户提供最佳的计算体验,将高效能计算带入每一个数据中心。

我们知道,ARM架构采用RISC精简指令集,因此有着更高的指令效率,CPU的体积更小,而且继承了ARM处理器的“节能”基因,加之华为业界领先的板级液冷和机柜级全液冷等方案,TaiShan服务器可以将数据中心的PUE降低至1.05。

当前全球数据中心的耗能已经占据世界用电总量的3%,华为鲲鹏920的推出,势必会得到更多客户的采纳。与此同时,由于采用“众核”架构,因此华为鲲鹏920可以做到最高64个物理CPU核,尤其适合大规模并行的计算场景。

基于以上,我们不难得出结论,华为鲲鹏920具有更好的性能功耗比,完全可以满足客户在高性能计算的需求。

华为为高性能计算提供的解决方案,是TaiShan X6000高密型服务器,能够在一个机柜里提供高达10240核的高密部署,而且支持液冷散热技术,适合大型数据中心和超算中心部署,是构建绿色数据中心的首选机型。

ARM HPC应用生态日趋完善

据悉,在高性能计算领域,经过两年的努力,华为已经为TaiShan服务器构建了完备的ARM HPC软件栈,能够帮助客户快速部署高性能计算应用环境,统一进行TaiShan HPC集群的高效管理,携手合作伙伴化解了商业、医疗、科学等领域最为艰巨的挑战。

以制造仿真、气象预测和基因测序等典型的高性能计算应用为例,它们无一例外均需要计算节点具有较大的内存带宽能力。基于鲲鹏处理器业界领先的8通道内存技术,TaiShan服务器能够提供高出业界33%的系统内存带宽,进而发挥TaiShan多核、高并发的算力优势。

事实上,几乎所有的高性能计算应用均对高算力和高内存带宽,有着非常突出的要求。算力越强、内存带宽越大,处理和分析数据的能力也就越强,才能更好地支撑各个领域的数据运营与智能运行——这本就是计算的本质。

华为TaiShan ARM服务器支持常见的NFS、Lustre、BeeGFS文件系统,其计算节点上使用的存储客户端和X86节点的存储客户端是完全兼容的,可以无缝接入到现有HPC集群中,能够为用户带来调度管理、存储共享等层面的上佳体验。

与此同时,TaiShan ARM服务器上运行业界广泛使用的Redhat、SUSE、CentOS等操作系统,都是标准发布的版本,而不是所谓的专用版,用户登陆服务器之后所使用的命令和操作,都和x86上一般无二,这就极大地降低了用户的上手难度和应用成本。

此外,涉及到高性能计算的基础软件,如编译器、MPI、调试器、函数库等,经过业界多年的努力,实际上已经做得很好,均可以在TaiShan ARM服务器上完美运行,华为也将提供对客户的全方位支持。

至于ARM HPC的生态,当前来看也已经不再是桎梏高性能计算的主要因素之一。目前各种开源或自有源码的应用,绝大多数是高级语言编写,从过去两年华为与ARM公司的测试来看,这些应用非常容易迁移到ARM平台上。

商业软件的迁移也不是技术问题,更多取决于各个公司的商业策略。通过与更多芯片、服务器以及ISV的合作,华为期望推动各类商业软件向ARM平台的移植,致力于建设一个合作共赢、日新月异的生态环境。

“芯开始,让智能计算无所不及。”TaiShan ARM服务器的洪荒之力,奋袂而起。


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。