英伟达CEO黄仁勋于6月1日在台北举办的GTC Taipei 2026大会上正式宣布,Vera Rubin平台已全面进入量产阶段。这是继今年1月CES之后,黄仁勋再次确认这款新一代AI超级计算机的量产进展。
台积电3nm制程加持,供应链规模翻倍
黄仁勋在演讲中特别感谢台湾供应链合作伙伴。他透露,Vera Rubin的供应链规模已达Grace Blackwell的两倍,每个系统包含近200万个零件,由150家台湾供应链伙伴共同完成组装。更令人瞩目的是,单个机架的组装时间已从Grace Blackwell时代的2小时大幅压缩至仅5分钟。
在制造端,整套系统始于台积电3nm制程,由7颗全新芯片组成,系统级聚合超过6万亿个晶体管、单板超过1.8万个元器件,整机由130万个零部件组成(第三代MGX机架设计)。HBM4内存分别来自美光、SK海力士和三星三家供应商。
无线缆设计与超强液冷
黄仁勋现场展示了Vera Rubin的制造全流程视频。系统采用无线缆PCB中板设计,所有ConnectX-9 SuperNIC和BlueField-4 DPU均为板载集成,以确保AI工厂级别的可靠性。液冷母排可承载超过5000安培电流,相当于20辆电动车同时全油门加速的瞬时功率。
微软、戴尔、CoreWeave首批部署
黄仁勋同时确认,微软、戴尔和CoreWeave已率先完成Vera Rubin NVL72工程机的部署和运行。目前数百万平方英尺的产能已上线支持Grace Blackwell交付,正同步为Vera Rubin爬坡做准备,大规模出货将在2026年下半年全面铺开。
互补产品线:Vera CPU与Groq 3 LPX
除了Vera Rubin平台,黄仁勋还展示了Vera CPU机架(单个液冷机架搭载256颗Vera CPU,负责模型编排和内存调度)以及全新的Groq 3 LPX低延迟推理机架(256颗Groq 3 LPU,40 PB/s SRAM带宽)。
黄仁勋强调,NVL72侧重最高吞吐量的Token生成,Groq 3 LPX则专攻最低延迟的Token生成,两者形成互补的产品策略,共同构建英伟达完整的AI推理解决方案。
据此前报道,黄仁勋在CES 2026演讲中指出,人工智慧所需的运算量正以每年10倍参数增长,测试阶段Scaling所需的Token处理量每年增长5倍,而Token成本则每年下降10倍。Vera Rubin的量产正是为了应对这一指数级增长的算力需求。