英伟达近日宣布,其全球首款专为AI智能体设计的处理器Vera CPU已正式从实验室迈向量产阶段,首批系统已交付至Anthropic、OpenAI、Oracle Cloud Infrastructure及SpaceX AI等顶尖AI实验室。
专为智能体时代打造的处理器
英伟达创始人兼CEO黄仁勋在GTC台北2026演讲中指出,过去的CPU设计始终以人类用户为核心——人类交互以秒为单位,云端CPU按核心数出租。然而智能体的世界以纳秒为单位:每次工具调用、数据库访问都要求极低延迟,任何等待都会阻塞下一步推理。黄仁勋直言:「过去我们为10亿人类造CPU,未来要为数十亿智能体造CPU。」
四大设计支柱
Vera CPU的设计围绕四大核心支柱展开:
- 单线程性能全球最高:每时钟周期可完成10条指令的取指、译码和执行,专注极低延迟而非传统吞吐
- 每核带宽世界一流:满足智能体高频数据调用需求
- 片内总带宽突破极限:全新互连架构以光速连接所有CPU核心,横截面带宽达3.6 TB/s,无chiplet边界、无跨芯片开销
- 极致能效:在不挤占GPU token生成电力的前提下最大化CPU部署
多项行业首发
Vera CPU同时创下多项行业纪录:全球首款支持PCIe Gen 6的CPU,首款搭载LPDDR5内存并实现1.2 TB/s带宽的服务器处理器——这一数字是当前最高性能x86 CPU的2至3倍。英伟达表示,CPU行业能做到5%的提升已属难得,10%更是罕见,但Vera CPU相比最强x86的性能差距已达到「前所未见的量级」。
三重角色与量产落地
在Vera Rubin NVL72机架系统中,Vera CPU承担三重关键角色:编排GPU和管理KV缓存、作为智能体harness层运行模型编排与工具调用、以及驱动全球最快的AI存储服务器。
英伟达超大规模与高性能计算副总裁Ian Buck亲自完成了首批交付,他表示:「代理式AI正在AI工厂中催生一个全新的CPU时刻——随着模型从单纯'回答问题'转向主动'采取行动',Vera正是为了保障这种工作负载在大规模下高效运转而量身打造的。」
黄仁勋此前还透露,英伟达已售出数百万颗Grace CPU,Grace Blackwell系列使英伟达已成为全球最大的CPU制造商之一。Vera CPU作为英伟达在AI基础设施领域的最新力作,标志着数据中心处理器正式进入「智能体优先」的新时代。