在GTC台北2026大会上,英伟达CEO黄仁勋首次详细阐释了Vera Rubin平台的底层设计逻辑。他将Vera Rubin定位为「Agent时代的基础设施」,强调该平台「不是一颗芯片,不只是一块GPU,而是一整套从端到端设计的系统」。
黄仁勋以Agent的运行机制解释了这套系统的必要性。他将Agent比作一个由多个器官构成的复杂生命体:大语言模型(大脑)在GPU上进行推理思考,每一次运算都会激活整排Grace Blackwell NVLink 72;编排引擎(身体)在CPU上调度全流程;工具调用(工作坊)同时调用CPU和GPU资源;安全层则交由BlueField DPU处理器负责,实现数据静态、传输和使用中的全程加密,遵循机密计算标准。
Vera Rubin全栈包含七大突破性芯片、五种机架配置,涵盖计算、网络与存储三大功能域:Rubin GPU搭配NVLink 6互联、Vera CPU、ConnectX-9 SuperNIC、BlueField-4 DPU安全处理器,以及DOCA软件栈。黄仁勋透露,全部CUDA X函数库将配备「Agent Skills」功能,让AI Agent能够像读说明书一样调用这些库,未来Agent使用CUDA X的效率有望远超人类开发者。
黄仁勋同时描绘了英伟达的战略转型轨迹:「公司已从GPU公司进化为系统公司,如今正再次转型——客户不想买计算机,他们要建AI工厂。」英伟达的生态已延伸至电力供应、液冷散热、电网等工业基础设施领域,目标是为客户提供完整的全栈系统,使其能够直接构建AI工厂。
随着推理计算进入爆发期,黄仁勋预计2027年全球AI算力需求将达万亿美元规模,而Vera Rubin平台正是为此量身打造的Token工厂底座。