• 1
  • 评论
  • 1

英伟达股票或将从这一新兴 AI 模型趋势中获益

老虎资讯综合2025-12-08

要点

  • 能够记忆并理解更长对话的推理模型,有望在明年提升对 AI 芯片的需求。

  • 英伟达计划于明年推出新的 Rubin CPX,专为超大上下文处理而设计,可处理百万 Token 级的软件编码。

  • Rubin CPX 使用 GDDR7 内存,使其总体拥有成本比使用高带宽内存(HBM)的竞争产品低三倍。

花旗(Citi)的分析师表示,能够记忆和理解更长对话内容的推理模型崛起,可能在明年推高对人工智能芯片和存储芯片的需求。凭借即将推出的新产品,英伟达看起来特别有望从中受益。

上周,亚马逊(AMZN)云服务(AWS)宣布了其 AI 代理平台的“情节式功能”(episodic functionality),允许系统“从过去的经验中学习,并将这些洞察应用于未来互动”,从而提升工具的决策能力。花旗分析师 Atif Malik 在周一的报告中表示,这项更新体现出“记忆是代理智能的关键要素”。

Malik 表示,为了让 AI 代理真正对客户有价值,其记忆能力必须超越短期和长期记忆,能够“理解当前互动的语境”。

11 月,谷歌也公布了一种新的方法,用于改善大型语言模型在持续学习方面的能力,灵感源自人类学习与记忆信息的方式。谷歌使用“嵌套学习”(Nested Learning)的理念来打造 Hope 模型,该模型在“推理、语言建模和记忆管理”等方面优于其他先进模型,Malik 指出。

推理模型需要更大的上下文窗口,以便理解并维持相关对话,Malik 表示,这正是英伟达(NVDA)在 9 月预告的新图形处理器(GPU)所要解决的问题。

Malik 表示,Rubin CPX 有望在明年年底随着 Vera Rubin 平台一起发布,是专为“以最低成本处理超大上下文 Token”而打造的,用于 AI 推理(运行模型)。Token 是 AI 模型处理的数据片段,开发者按输入和输出的 Token 数量收费。

Malik 表示,全新的 Rubin 芯片“让 AI 系统能够以突破性的速度和效率处理百万 Token 的软件编码和生成式视频”,并可与英伟达的 Vera CPU 及 Rubin GPU 协同工作。这意味着转向 Rubin 平台的公司能够“以前所未有的规模将其投资变现”。

他建模估算:客户每投资 1 亿美元,可从 Token 收入中获得 50 倍回报,即 50 亿美元。

Rubin CPX 的另一个优势是它采用 GDDR7 内存,比谷歌 TPU 和亚马逊 Trainium 芯片使用的高带宽内存(HBM)成本更低。Malik 表示,他预计 Rubin CPX 将在明年“让其他 AI 处理器倍感压力”,因为采用 GDDR7 可使其总体拥有成本比 HBM 方案低三倍。

花旗给予英伟达股票“买入”评级,并设定目标价 270 美元。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

举报

评论

empty
暂无评论
 
 
 
 

热议股票

 
 
 
 
 

7x24