• 3
  • 评论
  • 1

Vera来了!NVIDIA首款专为Agent打造的CPU交付AI顶级实验室

华尔街见闻07:05

英伟达自研CPU Vera已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付。Vera旨在满足Agent AI对CPU的需求,黄仁勋将Vera定位为公司"下一个数十亿美元级业务"。甲骨文已表态,计划于2026年起部署数十万颗英伟达Vera CPU。

英伟达将其自研CPU Vera交付给全球顶尖AI实验室,标志着这家芯片巨头在GPU霸主地位之外,正式开辟新的硬件战线。

英伟达副总裁Ian Buck于上周五亲手将首批Vera CPU系统送抵Anthropic、OpenAI及SpaceXAI三家机构,并于本周一完成对甲骨文云基础设施(OCI)的交付。

这是Vera CPU从今年3月GTC大会宣布至今,首次进入客户生产环境。英伟达CEO黄仁勋在GTC发布时将Vera定位为公司"下一个数十亿美元级业务"。

OCI方面已明确表态,计划于2026年起部署数十万颗英伟达Vera CPU,成为首家在超大规模环境中部署Vera的云服务提供商。

为何Agent AI需要一颗新的CPU

英伟达的核心论点在于:Agent AI的工作负载与GPU训练和推理有本质区别。

当AI模型从"回答问题"转变为"执行任务",大量并发的调度、工具调用、代码生成、长上下文检索等操作随之涌现——这些均属CPU密集型工作,并非GPU所长。Ian Buck在OCI交付现场表示:

"当AI模型被提问时,答案往往不是现成的,模型实际上需要生成Python代码才能得出正确答案,这正是我们看到CPU需求急剧攀升的原因。"

Vera搭载88颗英伟达自研Olympus核心,内存带宽达1.2 TB/s,满载情况下单核性能较前代提升50%。英伟达将其定位为专为高吞吐推理、Agent沙箱及强化学习工作负载设计的新一类CPU。

逐站交付:从旧金山到硅谷

上周五的首站交付在Anthropic位于旧金山SoMa区的办公室完成。Anthropic计算负责人James Bradbury接收了系统,并与Buck就Vera的架构特性进行了深入交流。Bradbury表示:

"扩展计算是模型成长的重要加速器,我们很高兴看到Vera在解决Agent工作负载方面展现出成为生态系统重要组成部分的潜力。"

在OpenAI位于Mission Bay的总部,计算基础设施负责人Sachin Katti接收了系统。Buck在交流中甚至当场取出螺丝刀,打开机箱盖,向对方展示系统内部构造。

当天最后一站是SpaceXAI位于帕洛阿尔托的办公室。英伟达团队向马斯克详细介绍了系统内部结构。SpaceXAI正评估将Vera用于强化学习工作负载及驱动其训练架构的基于Agent的仿真流水线。

OCI领跑超大规模部署

本周一在甲骨文AI客户中心,OCI产品管理负责人Karan Batta及首席客户与合作伙伴成功官Gary Miller对Vera系统进行了现场参观。Batta明确了OCI的部署意图:

"OCI计划从2026年起部署数十万颗英伟达Vera CPU,因为Agent AI需要大规模的持续性能。Vera的架构专为高吞吐推理工作负载而设计,能够提供OCI为下一代企业AI提供动力所需的效率、密度和占用空间。"

英伟达方面表示,OCI是首家在超大规模层面部署Vera的云服务提供商。

Miller则着眼于企业客户侧的验证需求,表示团队迫切希望让客户在该中心对Vera展开测试与定制,以充分释放其在Agent AI场景下的潜力。

Vera在英伟达整体架构中的定位

Vera并非孤立产品,而是英伟达"极致协同设计"体系的核心组件之一,与Rubin GPU、BlueField 4 DPU、Spectrum-X网络及MGX机架架构共同构成完整的AI工厂基础设施。

在Vera Rubin NVL72配置中,Vera通过第二代NVLink-C2C与两颗Rubin GPU相连,形成统一内存架构,使加速计算资源保持高效利用。

英伟达表示,Vera的高速核心与互连设计能够以传统基础设施两倍的能效,完成向GPU馈送数据所需的调度、控制与数据搬移工作。

对于投资者而言,Vera的正式交付提供了一个可追踪的商业里程碑:从OCI已公开承诺的"数十万颗"订单规模,到AI头部实验室的同步采用,英伟达正在将Agent AI对CPU的需求转化为可见的新增营收来源。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

举报

评论

empty
暂无评论
 
 
 
 

热议股票

 
 
 
 
 

7x24