在GTC Taipei 2026演讲收尾之际,英伟达CEO黄仁勋宣布了一则令业界瞩目的消息:全新推出的Vera CPU凭借创纪录的订单量,已成为公司历史上「速度最快、最成功的产品发布」。这款专为智能体AI量身打造的处理器,采用LPDDR5内存,性能达到传统CPU的两倍,黄仁勋更直言这「绝对是一个价值数十亿美元的业务」——尽管他本人从未想过会单独售卖CPU。
从GPU公司到基础设施公司
这场在圣荷西SAP中心举行的两小时主题演讲,吸引了约450家企业赞助、1000场技术会议和2000位演讲者,几乎覆盖了价值100万亿美元的全部产业。黄仁勋在演讲中系统阐述了英伟达的最新战略定位:已从传统的GPU公司、系统公司,进一步转型为AI全栈基础设施供应商。
英伟达在现场展示了全新的Vera Rubin系统,该系统集成7颗芯片、5台机架级计算机,其计算能力比10年前提升了惊人的4000万倍[1]。而高端迭代版本Rubin Ultra预计将于2027年下半年推出,将搭载144颗GPU[3]。
AI进入推理时代
黄仁勋的核心判断凝练为一句话:「过去六个月,一切都变了。Agent的落地与前沿模型的融合,让AI真正开始做有用的工作。」他指出,随着AI应用的规模化落地,整个行业的需求正从训练快速转向推理计算,AI基础设施正在进入「推理时代」。
这一判断背后有着坚实的数据支撑:英伟达全新推出的Groq 3 LPU(语言处理单元)由三星代工,经过Dynamo软件与Vera Rubin的协同优化,在高层推理层级让性能直接飙涨35倍,每兆瓦吞吐量同样提升35倍[1]。黄仁勋透露,基于Groq芯片的系统将于今年下半年正式出货[3]。
Agent:未来十年的通用范式
黄仁勋将Agent的计算模式定义为「模型 + 编排引擎 + 工具技能 + 运行时」的组合,认为这将是未来十年的通用范式。他盛赞OpenClaw是「人类历史上最受欢迎的开源项目」,并将其意义类比于Windows开启了个人电脑时代——「本质上开源了Agent计算机的操作系统,现在我们每个人都能创建自己的个人Agent」[3]。
这一范式将在多个领域反复复制:云端、企业、PC、机器人、自动驾驶、卫星、基站和工厂。黄仁勋同时强调,在物理AI领域,「真实世界的数据永远不够,我们需要来自AI与仿真的数据」。
展望未来,下一代Feynman架构预计将于2028年推出,将采用定制高带宽内存(HBM)[1]。英伟达的技术路线图显示,到2027年,AI基础设施市场规模有望突破万亿美元。