英伟达自研CPU Vera已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付。Vera旨在满足Agent AI对CPU的需求,黄仁勋将Vera定位为公司"下一个数十亿美元级业务"。甲骨文已表态,计划于2026年起部署数十万颗英伟达Vera CPU。
英伟达将其自研CPU Vera交付给全球顶尖AI实验室,标志着这家芯片巨头在GPU霸主地位之外,正式开辟新的硬件战线。
英伟达副总裁Ian Buck于上周五亲手将首批Vera CPU系统送抵Anthropic、OpenAI及SpaceXAI三家机构,并于本周一完成对甲骨文云基础设施(OCI)的交付。
这是Vera CPU从今年3月GTC大会宣布至今,首次进入客户生产环境。英伟达CEO黄仁勋在GTC发布时将Vera定位为公司"下一个数十亿美元级业务"。
OCI方面已明确表态,计划于2026年起部署数十万颗英伟达Vera CPU,成为首家在超大规模环境中部署Vera的云服务提供商。
为何Agent AI需要一颗新的CPU
英伟达的核心论点在于:Agent AI的工作负载与GPU训练和推理有本质区别。
当AI模型从"回答问题"转变为"执行任务",大量并发的调度、工具调用、代码生成、长上下文检索等操作随之涌现——这些均属CPU密集型工作,并非GPU所长。Ian Buck在OCI交付现场表示:
"当AI模型被提问时,答案往往不是现成的,模型实际上需要生成Python代码才能得出正确答案,这正是我们看到CPU需求急剧攀升的原因。"
Vera搭载88颗英伟达自研Olympus核心,内存带宽达1.2 TB/s,满载情况下单核性能较前代提升50%。英伟达将其定位为专为高吞吐推理、Agent沙箱及强化学习工作负载设计的新一类CPU。
逐站交付:从旧金山到硅谷
上周五的首站交付在Anthropic位于旧金山SoMa区的办公室完成。Anthropic计算负责人James Bradbury接收了系统,并与Buck就Vera的架构特性进行了深入交流。Bradbury表示:
"扩展计算是模型成长的重要加速器,我们很高兴看到Vera在解决Agent工作负载方面展现出成为生态系统重要组成部分的潜力。"
在OpenAI位于Mission Bay的总部,计算基础设施负责人Sachin Katti接收了系统。Buck在交流中甚至当场取出螺丝刀,打开机箱盖,向对方展示系统内部构造。
当天最后一站是SpaceXAI位于帕洛阿尔托的办公室。英伟达团队向马斯克详细介绍了系统内部结构。SpaceXAI正评估将Vera用于强化学习工作负载及驱动其训练架构的基于Agent的仿真流水线。
OCI领跑超大规模部署
本周一在甲骨文AI客户中心,OCI产品管理负责人Karan Batta及首席客户与合作伙伴成功官Gary Miller对Vera系统进行了现场参观。Batta明确了OCI的部署意图:
"OCI计划从2026年起部署数十万颗英伟达Vera CPU,因为Agent AI需要大规模的持续性能。Vera的架构专为高吞吐推理工作负载而设计,能够提供OCI为下一代企业AI提供动力所需的效率、密度和占用空间。"
英伟达方面表示,OCI是首家在超大规模层面部署Vera的云服务提供商。
Miller则着眼于企业客户侧的验证需求,表示团队迫切希望让客户在该中心对Vera展开测试与定制,以充分释放其在Agent AI场景下的潜力。
Vera在英伟达整体架构中的定位
Vera并非孤立产品,而是英伟达"极致协同设计"体系的核心组件之一,与Rubin GPU、BlueField 4 DPU、Spectrum-X网络及MGX机架架构共同构成完整的AI工厂基础设施。
在Vera Rubin NVL72配置中,Vera通过第二代NVLink-C2C与两颗Rubin GPU相连,形成统一内存架构,使加速计算资源保持高效利用。
英伟达表示,Vera的高速核心与互连设计能够以传统基础设施两倍的能效,完成向GPU馈送数据所需的调度、控制与数据搬移工作。
对于投资者而言,Vera的正式交付提供了一个可追踪的商业里程碑:从OCI已公开承诺的"数十万颗"订单规模,到AI头部实验室的同步采用,英伟达正在将Agent AI对CPU的需求转化为可见的新增营收来源。


