web-supplemented 2026-06-01 11:51 MiniMax-M2.7

NVIDIA Vera Rubin全面量产：台积电3nm加持，供应链规模翻倍

英伟达CEO黄仁勋在GTC Taipei 2026上正式确认Vera Rubin已全面量产，台湾供应链合作伙伴规模是上代Grace Blackwell的两倍，单机架组装时间从2小时压缩至5分钟。

nvidiavera rubin黄仁勋ai芯片台积电量产

References

英伟达CEO黄仁勋于6月1日在台北举办的GTC Taipei 2026大会上正式宣布，Vera Rubin平台已全面进入量产阶段。这是继今年1月CES之后，黄仁勋再次确认这款新一代AI超级计算机的量产进展。

台积电3nm制程加持，供应链规模翻倍

黄仁勋在演讲中特别感谢台湾供应链合作伙伴。他透露，Vera Rubin的供应链规模已达Grace Blackwell的两倍，每个系统包含近200万个零件，由150家台湾供应链伙伴共同完成组装。更令人瞩目的是，单个机架的组装时间已从Grace Blackwell时代的2小时大幅压缩至仅5分钟。

在制造端，整套系统始于台积电3nm制程，由7颗全新芯片组成，系统级聚合超过6万亿个晶体管、单板超过1.8万个元器件，整机由130万个零部件组成（第三代MGX机架设计）。HBM4内存分别来自美光、SK海力士和三星三家供应商。

黄仁勋现场展示了Vera Rubin的制造全流程视频。系统采用无线缆PCB中板设计，所有ConnectX-9 SuperNIC和BlueField-4 DPU均为板载集成，以确保AI工厂级别的可靠性。液冷母排可承载超过5000安培电流，相当于20辆电动车同时全油门加速的瞬时功率。

黄仁勋同时确认，微软、戴尔和CoreWeave已率先完成Vera Rubin NVL72工程机的部署和运行。目前数百万平方英尺的产能已上线支持Grace Blackwell交付，正同步为Vera Rubin爬坡做准备，大规模出货将在2026年下半年全面铺开。

除了Vera Rubin平台，黄仁勋还展示了Vera CPU机架（单个液冷机架搭载256颗Vera CPU，负责模型编排和内存调度）以及全新的Groq 3 LPX低延迟推理机架（256颗Groq 3 LPU，40 PB/s SRAM带宽）。

黄仁勋强调，NVL72侧重最高吞吐量的Token生成，Groq 3 LPX则专攻最低延迟的Token生成，两者形成互补的产品策略，共同构建英伟达完整的AI推理解决方案。

据此前报道，黄仁勋在CES 2026演讲中指出，人工智慧所需的运算量正以每年10倍参数增长，测试阶段Scaling所需的Token处理量每年增长5倍，而Token成本则每年下降10倍。Vera Rubin的量产正是为了应对这一指数级增长的算力需求。