web-supplemented 2026-06-01 13:02 MiniMax-M2.7

黄仁勋台北GTC再放豪言：Vera CPU创英伟达史上最快发布纪录，AI已全面进入推理时代

黄仁勋在GTC Taipei 2026演讲中宣布Vera CPU成为英伟达史上最快产品发布，同时揭示英伟达从GPU公司向全栈基础设施供应商的战略转型，并定义Agent计算为未来十年的通用范式。

英伟达黄仁勋GTC 2026Vera CPUAgent AI人工智能推理时代

References

黄仁勋GTC演讲现场 — 黄仁勋在GTC 2026台北站发表主题演讲，揭示AI全栈技术最新进展 Image source

在GTC Taipei 2026演讲收尾之际，英伟达CEO黄仁勋宣布了一则令业界瞩目的消息：全新推出的Vera CPU凭借创纪录的订单量，已成为公司历史上「速度最快、最成功的产品发布」。这款专为智能体AI量身打造的处理器，采用LPDDR5内存，性能达到传统CPU的两倍，黄仁勋更直言这「绝对是一个价值数十亿美元的业务」——尽管他本人从未想过会单独售卖CPU。

从GPU公司到基础设施公司

这场在圣荷西SAP中心举行的两小时主题演讲，吸引了约450家企业赞助、1000场技术会议和2000位演讲者，几乎覆盖了价值100万亿美元的全部产业。黄仁勋在演讲中系统阐述了英伟达的最新战略定位：已从传统的GPU公司、系统公司，进一步转型为AI全栈基础设施供应商。

英伟达在现场展示了全新的Vera Rubin系统，该系统集成7颗芯片、5台机架级计算机，其计算能力比10年前提升了惊人的4000万倍[1]。而高端迭代版本Rubin Ultra预计将于2027年下半年推出，将搭载144颗GPU[3]。

AI进入推理时代

黄仁勋的核心判断凝练为一句话：「过去六个月，一切都变了。Agent的落地与前沿模型的融合，让AI真正开始做有用的工作。」他指出，随着AI应用的规模化落地，整个行业的需求正从训练快速转向推理计算，AI基础设施正在进入「推理时代」。

这一判断背后有着坚实的数据支撑：英伟达全新推出的Groq 3 LPU（语言处理单元）由三星代工，经过Dynamo软件与Vera Rubin的协同优化，在高层推理层级让性能直接飙涨35倍，每兆瓦吞吐量同样提升35倍[1]。黄仁勋透露，基于Groq芯片的系统将于今年下半年正式出货[3]。

Agent：未来十年的通用范式

黄仁勋将Agent的计算模式定义为「模型 + 编排引擎 + 工具技能 + 运行时」的组合，认为这将是未来十年的通用范式。他盛赞OpenClaw是「人类历史上最受欢迎的开源项目」，并将其意义类比于Windows开启了个人电脑时代——「本质上开源了Agent计算机的操作系统，现在我们每个人都能创建自己的个人Agent」[3]。

这一范式将在多个领域反复复制：云端、企业、PC、机器人、自动驾驶、卫星、基站和工厂。黄仁勋同时强调，在物理AI领域，「真实世界的数据永远不够，我们需要来自AI与仿真的数据」。

展望未来，下一代Feynman架构预计将于2028年推出，将采用定制高带宽内存（HBM）[1]。英伟达的技术路线图显示，到2027年，AI基础设施市场规模有望突破万亿美元。

从GPU公司到基础设施公司

AI进入推理时代

Agent：未来十年的通用范式

相关文章