《电子技术应用》
您所在的位置:首页 > 人工智能 > 业界动态 > 英伟达官宣新一代GPU 推理算力是Blackwell的5倍

英伟达官宣新一代GPU 推理算力是Blackwell的5倍

2026-01-06
来源:快科技

1月6日消息,TheVerge报道,英伟达CEO黄仁勋在CES 2026主题演讲中宣布,新一代“Rubin计算架构平台已正式进入量产阶段。

该平台包含六款新型芯片,分别为Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU及Spectrum-6以太网交换机。目前,这六款芯片已从合作制造方处回厂,并通过部分关键测试,整体进度正按计划推进。

s_613f01226e9343dfb9b8f7d9341f3eac.png

据英伟达公布的数据,Rubin平台的训练性能达到前代Blackwell的3.5倍,运行AI软件的性能提升5倍。此外,其推理token生成成本可降低多达10倍,训练混合专家模型(MoE)所需的GPU数量也减少至原来的四分之一。

新一代Vera CPU配备88个核心,性能为替代产品的两倍。该处理器专为代理推理设计,被视为大规模AI工厂中能效最高的CPU,采用88个定制Olympus核心,支持完整Armv9.2架构,并搭载高速NVLink-C2C互连技术。

Rubin GPU集成第三代Transformer引擎,具备硬件加速自适应压缩功能,可为AI推理提供50 petaflops的NVFP4算力。每个GPU带宽达3.6TB/s,而Vera Rubin NVL72机架的整体带宽更提升至260TB/s。

英伟达同时透露,包括亚马逊AWS、谷歌云、微软Azure和甲骨文云在内的多家云服务商将于2026年率先部署基于Vera Rubin的实例。此外,CoreWeave、Lambda、Nebius和Nscale等云合作伙伴也将陆续跟进。

s_77a3637ca4dc41d4b3ed6dd8240ae4b2.jpg


subscribe.jpg

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。