《电子技术应用》
您所在的位置:首页 > 模拟设计 > 业界动态 > 华为详解昇腾AI芯片:自研达芬奇架构 算力和能效比大幅提升

华为详解昇腾AI芯片:自研达芬奇架构 算力和能效比大幅提升

2018-10-14

华为在全联接大会2018上,首次宣布了华为的AI战略以及全栈解决方案。与此同时,华为发布了自研云端AI芯片昇腾(Ascend)”系列,基于达芬奇架构,首批推出7nm的昇腾910以及12nm的昇腾310。

其中,昇腾910是目前单芯片计算密度最大的芯片,计算力远超谷歌和英伟达。昇腾910半精度(FP16)运算能力为256TFLOPS,比NVIDIA的TeslaV100要高一倍,整数精度(INT8)512TOPS,支持128通道全高清视频解码(H.264/265),最大功耗350W。

昇腾310芯片的最大功耗仅为8W,主打极致高效计算低功耗AI芯片。半精度(FP16)运算能力8TFLOPS,整数精度(INT8)16TOPS,支持16通道全高清视频解码(H.264/265)。这两款AI芯片和大规模分布式训练系统都将在明年第二季度推出。

t01685a6df7eb4d154f.jpg

日前,华为终端手机产品线总裁何刚发布长图,详细介绍了昇腾310的用途以及设计细节。

何刚表示,昇腾310作为华为全栈全场景AI解决方案的关键部分,是华为全面AI战略的重要支撑。在设计方面,突破了人工智能芯片设计的功耗、算力等约束,实现了能效比的大幅提升。未来将为平安城市、自动驾驶、云业务和IT智能、智能制造、机器人、便携机、智能手机、智能手表等应用场景提供全新的解决方案。

昇腾310采用华为自研达芬奇架构,使用了华为自研的高效灵活CISC指令集,每个AI核心可以在1个周期内完成4096次MAC计算,集成了张量、矢量、标量等多种运算单元,支持多种混合精度计算,支持训练及推理两种场景的数据精度运算。

统一架构可以适配多种场景,功耗范围从几十毫瓦到几百瓦,弹性多核堆叠,可在多种场景下提供最优能耗比。


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。