• 2
  • 评论
  • 3

黄仁勋最新演讲3万字全文:Agentic AI已真正到来

王铮Silvia06-01 18:26

Agentic AI已真正到来,核心架构是"LLM+Harness":大模型强大的推理规划能力,与框架的工具调用、记忆管理和协调能力成熟,带来质变。

黄仁勋:

非常高兴见到你们所有人。回家的感觉真好。我把我的父母也带回来了。大家为我的父母鼓掌——也为我们开场秀的超级明星鼓掌。女士们先生们,你们看他们多可爱。

今天有这么多人在这里。我们正在把这场演讲直播到台湾另外70个观看现场。70场不同的会议正在同时进行。所有人都在看这场主题演讲。

我们有太多要告诉你们的事情,也有太多合作伙伴要感谢。台湾的生态系统变得如此庞大,令人难以置信。

大多数时候,人们谈到生态系统,想到的是我们的软件栈,是 Nvidia 构建的计算系统之上的开发者生态。但我们的生态系统向上游延伸到台湾的整个供应链——一切从这里开始——向下游一直延伸到数据中心,最终到达终端用户。

今天,我们几乎要谈及整个生态系统。有太多人要感谢。我热爱台湾的生态系统。这里有太多公司,有些是我最喜爱的生态伙伴。台湾丰富的生态系统,是最丰富的生态系统,是全球最好的供应链生态系统。令人难以置信。

感谢大家来到这里。今年,我们的业务共同实现了惊人的增长。事实上,昨晚有人告诉我,台湾今年的年度 GDP 将增长接近 10%。好了,我们有很多要讲,开始吧。

Agentic AI已真正到来,正让软件开发者

生产力暴增三倍,成为GDP引擎和利润引擎

两年前我在这里,开始和大家谈论 AI 是如何从生成式 AI 向其他浪潮演进的。下一波 AI 是 Agentic AI(智能体 AI)。

而今天,我们可以说:Agentic AI 已经到来,真正有用的 AI 已经到来。

这意味着什么?这是 GitHub,当然是 Agentic AI 最早的应用之一——软件编程。这是最有价值的职业之一,生态系统极其庞大——全球有 3000 万到 4000 万专业软件开发者,加上学生和爱好者可能还要再多几百万。

但可以说,全球有 3000 万到 4000 万软件开发者以编程为生,这张图代表了其中大多数人。这是 GitHub。Pull request 是当他们下载软件、进行修改的动作,commit 是他们把代码提交回去的动作。

你们看看这个:2023 年,提交次数是 3 亿次;2024 年,4 亿次;2025 年,5 亿次。而在 2026 年的头几个月,这个数字几乎翻了三倍。

图片

这意味着什么?3000 万软件开发者代表了大约 3 万亿美元的 GDP 贡献——他们的薪资总额就是 3 万亿美元,而这 3 万亿美元的薪资带动了其余产业的经济增长。世界上大约 100 万亿美元规模的产业,是由这 3 万亿美元的薪资驱动创造的。

而现在,这 3 万亿美元的薪资正在产生近三倍的产出——实际上是用 3 万亿美元的薪资创造了 9 万亿美元的生产力。有没有道理?这种差距绝对是非同寻常的。这就是 AI 的潜力,这就是 AI 的承诺。

软件工程师的数量实际上还在增加。说 AI 在减少就业岗位——完全无稽之谈。恰恰相反,AI 正在促使更多软件工程师被招募。

原因很简单:如果你能雇一名软件工程师,然后他能创造 9 万亿美元的生产性工作,你为什么不想多雇一些呢?如果那条曲线是平的,那么人们自然会减少雇用。但因为产出如此惊人,人们反而想雇用更多软件工程师。这种影响很快就会体现在我们的经济中。

所以,第一点是:真正有用的 AI 已经到来。

从产业视角来看,这意味着 token 现在面临着极其旺盛的需求——因为如果你能做到这一点,你会想要创造更多。

而且,由于 token 现在是有利润的收入单位,AI 公司们希望构建更多 token,生成更多 token,建造更多 AI 工厂——这正是台湾的算力需求飙升的根本原因,也正是你们都如此繁忙、业务如此出色的原因。

事实上,那看起来就像是你们某些公司的股价走势。

计算模式已经改变,一切都变了。所以第一个关键认知是:有用的 AI 已经到来。AI 现在是利润引擎。AI 现在是 GDP 引擎。

Agentic AI的核心架构是"LLM+Harness"

大模型强大的推理规划能力,与框架的工具

调用、记忆管理和协调能力成熟,带来质变

在这背后,是一种全新的计算模式——不仅仅是一个大语言模型,而是一个智能体(agent)。

今天,我们几乎所有要谈的内容都将基于此。让我用一点时间向你们展示我说的"内部"是什么样的。

这就是一个智能体——一个智能体应用。以前,这是应用程序,这是代码,这是操作系统——应用代码在应用程序内运行,应用程序在操作系统内运行。

图片

今天,它是智能体——由一个或多个大语言模型,加上一个"框架(harness)"构成。框架帮助它、协调它去完成有价值的工作。

这是输入。当输入进来时,它需要理解、观察、推理、行动、使用工具。那个工具可以是电子表格、网络浏览器、数据处理引擎、数据库引擎等等。

这一切都在被协调——这个框架每次都在协调信息的流转:处理上下文、理解正在发生的事情、推理该做什么、制定计划并行动——整个协调路径都由软件来调度。

所以这从根本上就是一个智能体。它处理短期记忆(称为工作记忆)和长期记忆——就像我们人类一样,我们也有长期记忆。所以记忆管理系统极其重要。

这整个系统就叫做智能体。大语言模型用于思考,框架将一切连接在一起,就像操作系统一样,这就是新的计算模型。这就是智能体能做的不可思议的事情。

这是一次重大突破:大语言模型能够真正做好思考、推理、规划、使用工具,同时我们拥有了管理记忆、协调调度、使用工具的框架——两者同时收敛,我们现在能做的事情令人叹为观止。

让我给大家举些例子。这是一个提示词。这是生成的代码。这是输入,那是输出。你们觉得怎么样?很厉害,对吧?

我们这里用的是 Claude Code,但 Codex 也表现得非常出色。再看另一个例子。输入是:"创建一个 GIF——黑色背景上的 Nvidia 绿色光点,以散点形式分布,变形为台北 101 大楼,再变形为 GTC 台北 2026,再变形为 Nvidia 标志,然后散开。

(循环播放)

"你看到了那个提示词。下一个例子:"我的遥控器电池卡扣丢了。"看起来就是这样。"创建一个 CAD 文件——使用工具,创建可用于 3D 打印的 CAD 文件,做一个新的卡扣。"

这就是新的计算模式:以前我们打开应用程序,点击和打字;现在我们换成向 AI 解释我们想要什么、我们的意图,然后 AI 生成代码或使用工具,产生必要的输出。这就是未来计算机的工作方式。

这就是 Agentic AI。两年来,我们一直在为此而构建,现在它已经到来。

Agentic AI将开启软件公司黄金时代

CUDA X库将成为智能体最强大工具,

推动计算模式根本变革

当然,工具的使用是一大突破。

很多人曾经说:"Jensen,AI 来了,Agentic AI 来了,所以所有软件公司都会倒闭。"我说恰恰相反——因为将有如此之多的智能体,世界将不再受人口数量的限制,因此那些智能体将比以往任何时候都使用更多的工具。

对于软件公司来说,这其实是一个难以置信的好时代——但软件必须以智能体能够使用的方式呈现给它。这是一个重大突破。

事实上,我们已经做到了——正如你们所知,Nvidia 的宝藏是我们所有的 CUDA 库。我称之为 CUDA X 库。这是 Nvidia 的宝藏。

今天,我们能够将这些 CUDA X 库呈现给智能体——智能体甚至比人类更能有效地使用它们。所以现在是 CUDA X 大展身手的绝佳时机。我们来看看。

图片

【产品介绍视频】— CUDA X 库

“二十年前,我们构建了 CUDA——一个用于加速计算的统一架构。

我们重新发明了计算。1000 个 CUDA X 库帮助开发者在科学和工程的每一个领域取得突破。

CUDA X 库就是智能体的工具。cuLitho 用于计算光刻;cuOpt 用于决策优化;cuDSS 用于直接稀疏求解;AIQ 用于跨结构化和非结构化文档的深度研究;Aerial 用于 AI RAN;Warp 用于可微分物理;PhysX 用于基因组学。

在这一切的根基上,是算法——而算法是美的。”

图片

为美妙的数学鼓掌。软件的计算模式将要改变。让我们回到这里。

这就是智能体。它是终极的去中心化、分布式计算模型。为了处理这个智能体,将有非常多不同的计算机被激活。

智能体由模型、框架、工具与技能(skills),以及运行时(runtime)组成。这一切都运行在数据中心的不同地方。

你可以把模型想象成大脑,框架是身体,它使用的工具运行在运行时中——把它想象成一个工坊。所以这就是一个人,一个工人,在工坊里使用工具工作。

当然,这是在极其大的规模上进行的,每个步骤都运行在计算机的不同部分。你可以看到,大语言模型在思考——处理上下文、观察、理解环境、推理、制定计划、执行计划。

每次这个过程发生,一整个机架的 Grace Blackwell NVLink 72 都会被激活。它在用大语言模型思考。每当它使用工具时,就会用到 CPU——那个工具可能是 C 编译器,可能是 Python,可能是 JavaScript,也可能是加速计算。

今天的智能体对工具的使用还比较简单。明天,它们将成为非常成熟的工具使用者——这就是为什么我向你们展示的 CUDA X 库将来在智能体中会极受欢迎。

它们解决了世界上一些最重要的问题。我们所有的 CUDA X 库现在都会附带技能(skills),让 AI 学会如何使用它们。CUDA X 库有技能——基本上就是一本说明书,AI 读完后会想:"啊,原来是这样用的。"智能体使用这些库的能力将会是惊人的。

Agentic AI驱动全新异构计算架构,Vera Rubin是端到端系统级革命,Vera是专为Agentic系统设计的全新CPU,将开辟一个全新、更大的市场

Agentic AI驱动全新异构计算架构

Vera Rubin是端到端系统级革命,

而非单纯的芯片升级

所以,工具在 CPU 和 GPU 上运行,大语言模型负责思考,安全框架运行在 CPU 和安全处理器(DPU——Nvidia 的 BlueField)上,整个系统的协调在 CPU 上运行。这是整个框架,CPU 协调着所有的工作。


最难的部分之一是记忆。可以想象:工作记忆叫做 KV 缓存。要记住什么、压缩——不只是压缩,还有如何检索。检索结构化数据?检索非结构化数据?所有这些不同数据之间的关系本体论是什么?整个处理过程极其复杂。AI 的记忆系统将使存储系统发生彻底的革命。

可以看到,这种计算模型的每一个方面——这个叫做"智能体"的新应用——都和以前应用程序的运行方式根本不同。以前是一大堆软件坐在一个二进制文件里,坐在操作系统里。

正是这种去中心化、分布式、异构的计算挑战,是我们构建下一代 Vera Rubin 的根本原因。

图片

Vera Rubin 不是一颗芯片。Vera Rubin 不仅仅是 GPU。它从 GPU 开始,但 Vera Rubin 极其不凡。

从端到端,整个系统都是 Vera Rubin:它有 GPU,有 Vera Rubin NVLink 72,它由 Vera CPU 来协调——关于这个我稍后会详细介绍。

存储系统,革命性的 Vera,加上 CX9,加上 DOCA 软件栈,以及内置的安全处理器——让静止时、传输中乃至使用中的一切都被加密。整个系统中的一切都是安全的,因为 AI 模型太宝贵了。这就是为什么整个系统遵守保密计算规范。

这些系统中的每一个,单独来看都是一场完整的革命。Vera Rubin 是我们公司历史上最宏大的壮举。全公司所有 4 万名工程师都参与了 Vera Rubin 的工作,更不用说你们所有人也参与了这个整体系统的创造。

Vera Rubin 真的是个奇迹。而且它不只是一颗芯片,它包含了太多太多。

客户的需求不再是买电脑,而是建AI工厂

未来10年内将有100吉瓦的AI工厂上线,

DSX平台运行最高效率、最低成本的token

那还有更多吗?很久以前,Nvidia 只是一家 GPU 公司。但多年来,我们演进了。我们成为了一家系统公司——你们现在看到的是有史以来最复杂的系统,从零开始设计的最复杂系统。

但归根结底,我们的客户和合作伙伴不想买电脑——他们想建 AI 工厂。这就是为什么 Nvidia 又一次开始深刻转型。

你们可以看到,我们的技术现在已经延伸到整个基础设施层面。我们的合作伙伴处于基础设施层面——发电企业、冷却系统、电网供应商。如此之多的工业公司现在已经成为我们生态系统的一部分,因为我们最终是在尝试构建一整个技术栈。

就像 GPU,就像我们当年构建 Grace Blackwell NVLink 72,就像我们现在正在构建完整的全栈系统,让我们的客户能够建造出色的 AI 基础设施。我们来看看。

图片

【产品介绍视频】— DSX AI 工厂平台

“世界正在竞相建造 AI 工厂——人类历史上规模最大的基础设施建设浪潮。AI 工厂极其复杂:每一层——芯片、机架、网络、电力、冷却、电网——都必须从端到端整体设计,因为算力就是营收。

Nvidia DSX 是这张蓝图——一个以最高效率和盈利能力建造并运营 AI 工厂的参考设计。

它从 DSX Sim 开始:借助 DSX Sim Omniverse Blueprint,合作伙伴可以在第一个机架落地之前,先设计和验证一座 Nvidia Vera Rubin AI 工厂——规划布局、模拟电力和冷却、设计网络、验证每一项集成、在数字孪生中测试每一处变更。

工厂通电后,DSX OS 接管,负责配置、运营、监控和修复基础设施,将已安装的系统转化为可信赖的、多租户、高弹性、AI 就绪的算力资源。

图片

当今的 AI 工厂在电力方面超额配置高达 40%。DSX MaxLPS 让运营商在相同的电力预算内安全部署更多 GPU,每年增加数十亿美元的收入。

突破性的 45 摄氏度热液冷却技术减少了水和能源的消耗,让更多电力流向创造收入的计算。动态电力分配在机架之间调度功率,回收闲置瓦特,将它们送往有工作需求的地方。电力平滑技术抑制整个工厂的峰值电流尖刺和功率浪涌。

AI 智能体团队持续与 DSX MaxLPS 协作,动态平衡冷却与电力以响应工作负载需求。DSX AI 工厂是灵活的能源资产,可与电网协作运营。DSX Flex 读取实时电网信号,在电网需要减负时动态调整工厂功率。

10 年内将有 100 吉瓦的 AI 工厂上线。Nvidia DSX AI 工厂运行效率最高,生产成本最低的 token,并让电网更稳健。”

AI云在各国快速兴起,服务本地及全球客户

这些AI云都需要NVIDIA完整的底层技术栈

和全球开发者生态

我曾经向你们展示过生态系统幻灯片,那时 Nvidia 的计算层、软件和计算栈被整合进其他人的平台——第三方平台和库——服务于终端市场。那是一个计算生态系统。

图片

这是一个 AI 工厂生态系统——在我的下游。在我的上游是你们所有人,在我们的下游是这个生态系统。因为 Nvidia 最终不只是在制造 GPU,不只是在制造系统——我们在帮助客户建造 AI 工厂、AI 基础设施,而这是极其复杂的事情。

每一座达到 1 吉瓦规模的 AI 工厂,一开始是 200 到 300 亿美元,现在是 500 到 600 亿美元,很快将达到每吉瓦 800 到 1000 亿美元。1000 亿美元投入一座 AI 工厂——它必须第一次就能工作,必须立刻运转。资本成本之高令人咋舌,复杂程度令人叹为观止。

所以,我们以前是在电脑里设计一颗芯片,然后在电脑里仿真一个系统。今天,你们刚刚看到了——一切都在 Omniverse 里构建。

我和你们一起用 Omniverse 工作已经很久了。这是梦想成真——这样我们就能在数字框架、数字仿真器、数字世界里建造这些巨大的系统,大到世界想要建多大就能建多大,而且是在我们破土动工、投入资金之前很久就先做到这一点。这就是我们的生态系统,我们称之为 DSX。

RTX 是我们的 GPU;DGX 是我们的系统;现在 DSX 就是基础设施。正是因为我们在这整个技术栈上所做的工作——包括我们的系统和软件——才使我们能够与小型公司合作,让他们成为世界级的 AI 云。

我接下来要展示的每一家,不久前都还是小公司,而现在 CoreWeave 已经价值 600 到 700 亿美元,而且还在快速增长。最近,我们与 Nebius 合作——他们也在飞速增长。

图片

这些云的客户都极为出色。Cursor,软件编程公司。Black Forest Labs,图像生成。World Labs,世界基础模型。Revolut,领先的金融服务 AI 公司。还有 Shopify。

再看另一家。这是 NScale,他们的客户有英国电信。Google 正在使用我们的一家 AI 云。Thinking Machines,Frontier Labs 的公司。非常令人振奋。

图片

这是韩国的 Naval Cloud——韩国银行、现代汽车,还有许多令人叹为观止的公司。这是印度的 Yotta,了不起的公司。

图片

这是一家总部在新加坡、在澳大利亚建设的公司——Together AI,新加坡。这是印度尼西亚的一家。这些公司中的每一家都在服务区域性及全球性客户。

AI 将无处不在。每家公司都将由它驱动。每个地区都将建造它。印度尼西亚的 Indosat。台湾的 GMI——可以鼓掌。

太了不起了。如此多了不起的公司,如此巨大的机遇。但他们都需要几样东西。当然,他们需要计算技术栈——这整个底层技术栈,这是让 Nvidia 闻名于世的东西。我们所有的硬件、软件和库,以及我们与全球第三方开发者生态系统的连接,让任何人都能搭建起一个 AI 云。

算力即营收,TCO定胜负,选择Nvidia

的三大理由:快速上线与启动,顶级的

每瓦token吞吐量,系统使用寿命更长

但是,AI 云现在如此复杂了。这是软件版本,计算机科学版本。资产版本是我之前展示给你们的——那是一座巨大的工厂。

仅凭这种能力还不够,这就是为什么 Nvidia 现在已经成为一家 AI 基础设施公司。在这方面做得出色——在帮助客户建造并部署 AI 工厂方面变得极其精通——至关重要。原因在于:算力就是营收。算力就是利润。没有营收和利润就是亏损。

所以,真正重要的是:当一个 AI 基础设施上线时——它可能上线得很快,也可能需要一段时间。它的吞吐量可能很高,也可能很低。它的弹性和可靠性可能好,也可能差。它的有效使用寿命可能很长,也可能很短。因为这代表着 500 亿到 600 亿直至 1000 亿美元。

这条曲线至关重要,这就是为什么与 Nvidia 合作是如此强大的事情——因为我们具备全面集成的能力。我们不是只拿出一张 PPT 幻灯片,我们创造了整个基础设施。

我们将一切连接起来,我们自己也亲自大规模建造了这一切,以确保一切运转良好。因此,我们的首次 token 时间、首次推理时间、训练启动时间都要快得多。

其次,我们每瓦吞吐量,也就是每瓦 token 数,是绝对的世界顶级水平。原因在于我们整合一切、从零开始设计一切、仿真整个系统,并采用极致协同设计——就像我刚才在 Vera Rubin 机架演示中向你们展示的那样。

一切都是为了实现这种惊人的吞吐量而设计的。如果你的数据中心、你的工厂有 1 吉瓦,就只有 1 吉瓦——不会更多。1 吉瓦就是 1 吉瓦,那是你能使用的全部发电量。有了 1 吉瓦的功率,每瓦吞吐量就是营收,因为每一个 token 都是有利润的。每一个 token 都是营收。

这就是未来。算力就是营收。每瓦性能就是你的营收。仅仅因为芯片更便宜就选错架构,这根本说不通。你需要确保你的营收最大化。买得越多,挣得越多。所以,token 就是营收。

接下来的因素是可靠性。如果你有机会去看看这些数据中心——有如此多的活动部件,数百万条线缆,要让所有那些计算机和谐协作,可靠性极难保证。我们已经在极大规模下运营了很长时间,这种经验非常重要,中断时间间隔的差异极为关键。

最后一点,也是非常困难的一点:系统的使用寿命。

软件一直在变化。四年前,也就是 Hopper 的时代,AI 已经彻底改变。六年前,Ampere 的时代,AI 已经彻底改变。

我们一开始谈的是 CNN,然后我们谈 Transformer,然后混合专家模型,现在我们在谈 Agentic 系统。每一代,每隔几个月,软件行业都会涌现出新技术。

如果你的架构不够灵活,如果你的生态系统不够丰富,那么这条曲线就无法延伸很长。你无法预测你的系统能使用多久。

但我能。Nvidia 的系统遍布全球,软件开发者从 Nvidia CUDA 起步——因此,这个生态系统、这个可用资产的生命周期自然会长得多。差别在本质上就是成本。你可以从营收角度看,但营收的另一面就是成本。如果资产的使用寿命长,总体拥有成本(TCO)就低。这就是差别所在。

Vera Rubin已全面量产,供应链规模是

Grace Blackwell的两倍,单机架组装

时间从两小时压缩至5分钟

你们所有人正在和我一起经历这一切,对吧?你们的需求,你们的工厂在拼命运转,你们的员工在台湾各地拼命工作。因为每个人都想赚钱。他们意识到,有用的 AI 来了,有利润的 AI 来了,算力需求极其旺盛——算力需求就是那个制约因素。

所以让我们一起拼命工作,帮助世界到处建立 AI 工厂。这就是为什么这件事如此重要。

我非常高兴。我站在你们面前宣布:Vera Rubin 已进入全面量产。

图片

Vera Rubin 已进入全面量产!我们为 Vera Rubin 建立的供应链是 Grace Blackwell 的两倍规模。令人难以置信。

而且,以前组装一台 Grace Blackwell 机架需要两个小时,现在只需要 5 分钟。所以不仅产能更高,生产效率也快得多。而且我们全都需要,来支撑这样的需求。

这个生态系统非同凡响。数百万平方英尺的产能已经上线,支持 Grace Blackwell,现在正在准备、正在提速——Vera Rubin。我想感谢你们所有人。

Vera Rubin 现已全面量产。谢谢大家。我们来看看。

图片

【产品介绍视频】— Vera Rubin 量产与供应链

“大语言模型生成答案。而今天,AI 智能体能够完成真正的工作。

但处理 Agentic AI 是一个完全不同的计算问题。智能体需要观察、推理、规划、使用工具,管理海量的上下文,同时兼顾工作记忆和长期记忆,还要按需启动子智能体作为专家。

Vera Rubin 是一个多机架、机群(Pod)级规模的系统,专为处理 Agentic AI 而生,现已全面量产。整个供应链中制造自动化与统筹协调的景象——真是奇迹。

图片

我们的旅程始于第一台 AI 超级计算机 Nvidia DGX1 的发布。在接下来的十年里,我们把每一颗芯片和每一个系统都推向了极限——从 Pascal 和第一代 NVLink,到 Grace Blackwell(第一台机架级 AI 超级计算机),再到现在的 Vera Rubin——第一台为 Agentic AI 时代而生的多机架机群级超级计算机。

一切从台积电开始。构成 Vera Rubin 的七颗新芯片,经过数百道工序成型。3 纳米制程。CoWoS-R 和 CoWoS-L 封装。

来自美光、SK 海力士和三星的 HBM 内存。

Vera Rubin 计算单元:6 万亿个晶体管,单块板卡超过 18000 个元器件。Vera Rubin NVL72 负责"思考"——提示词与上下文理解、推理与规划。

接下来是全新模块化计算托盘,采用全新 PCB 中板设计大幅简化。超级芯片、ConnectX9、SuperNyx、BlueField 4 DPU——全部就地集成,无需线缆,实现 AI 工厂规模的高可靠性。

18 个计算托盘。9 个热插拔 NVLink 交换机托盘。全新高效歧管。液冷母排,承载超过 5000 安培的电流——相当于 20 辆电动汽车满速加速时的功率。

共计 130 万个元器件,构成第三代 MGX 机架设计。

恭贺微软成功运行 Vera Rubin NVL72 工程验证机架。同样恭贺戴尔和 CoreWeave 成功搭建 Vera Rubin NVL72 工程验证机架。

然后是 Vera CPU 机架:单个液冷机架内 256 颗 CPU,负责协调模型、调度内存、启动工具——在富士康和广达完成生产。

Grok 3 LPX 成型:16 个托盘共 256 颗 Grok 3 LPU。40 PB/s 的 SRAM 带宽,实现超低延迟。NVL72 以最高吞吐量生成 token,而 Grok LPX 以最低延迟生成 token。

Vera BlueField 4 STX——AI 的记忆所在之处。BlueField 4 加速存储处理,连接内存与存储。

以及硅片层面:Nvidia Spectrum-X 以太网光子模块——全球首款搭载 200 吉比特协同封装光学模块的以太网交换机。台积电的 CoWoS 工艺,芯片级封装,磷化铟上的超高功率激光芯片。

Vera Rubin:5 套相互连接的机架级系统——一台为 AI 智能体而生的超级计算机。台湾遍布各地的 150 家供应链合作伙伴。数百万平方英尺的厂房。数百个生产点位。芯片、封装、系统和数据中心,在尺寸、功率和规模上都被推到了极限。

图片

这就是我们所说的"极致协同设计"。我们和台湾一起完成了这一切。携手共进,我们为 AI 时代重新发明了计算。台湾在起点时与我们同行,今天又见证着我们将 Vera Rubin 带到世界。谢谢,台湾。”

详解Vera Rubin NVLink 72机架全系统

专为Agentic AI设计,是世界上运行复杂

智能体的最先进计算平台

女士们先生们,Vera Rubin 不只是为了 AI 而生。Vera Rubin 不只是为了运行 AI。Vera Rubin 是为了运行智能体而生。这是一个 Agentic 系统。

想象一下其中的复杂性——这也是为什么智能体是计算机科学最后一次重大突破。花了这么多年,智能体才终于实现了它的潜力、变得真正有用。运行它的计算机,理应是世界上最先进的。这就是 Vera Rubin。

能不能把 Vera Rubin 带出来?Janine,机架和系统准备好了吗?看起来很重。这是 Vera Rubin NVLink 72。这是 Grok LPX。在下次 GTC 上,我会向大家更多介绍这些内容。今天我们有太多要讲。

图片

这是 Vera CPU 机架——256 颗 CPU,全液冷。等一下我会介绍 Vera CPU 的细节。这是 Vera BlueField 存储处理系统,也是安全系统。当然,这是我们的 Mellanox 网络——全球首款 CPO(协同封装光学)交换机。这就是 Vera Rubin。令人惊叹的技术全部汇聚于此。

当年我们做 Hopper 的时候,是为了预训练——当时预训练是最重要的应用,是我们最重要的工作负载。

后来我们做 Grace Blackwell 的时候,所有人都说:"Jensen,Nvidia 在预训练上真的很厉害——但推理很简单,我们也能做。"大家还记得吗,人们曾经说"推理太简单了"。

但如你们所知,推理等于金钱,而 MoE 模型极其复杂——要同时实现超高响应速度、快速交互性和高吞吐量,极其困难。这就是我们创造 NVLink 72 的原因。

今天,Nvidia 的 token 成本是全球最低的——不是低 10%,是 X 倍,是数量级的差距。完全是因为我们做了极致协同设计,完全是因为我们理解了推理的计算模型和计算模式,因而能够创造出 NVLink 72。

图片

现在有了 Vera Rubin,它超越了推理。它现在是在一个 Agentic 系统中做推理。这就是 Vera Rubin。

没有线缆,没有水管,没有风扇。上次我向大家展示时,到处都是线缆,看起来蔚为壮观。但现在中间有一块 PCB 把两侧连接起来。以前需要两个小时的事,现在只需要 5 分钟。Vera Rubin 的可靠性和弹性将会无与伦比。

这是我们的 Vera CPU 托盘——有史以来制造出的最先进的 CPU。我马上会为大家展示。这是我们的存储托盘——两颗 Vera CPU,4 颗 CX9,大量软件。

这是我们全新的 LPX——Grok 系统,专为极低延迟推理而设计。吞吐量由 Vera Rubin 提供,并由 NVLink 72 进一步扩展。如果想进一步扩展,还可以加上 Grok LPU。

图片

这是 Vera Rubin NVLink 交换机托盘——交换机就在中间。这非常革命性,正是因为 Vera Rubin、NVLink 72,以及我们创造和发明的 NVLink 交换机。

这是我们用于横向扩展的以太网交换机。令人惊叹的是,我们最初为 Grace Blackwell 引入了这两套系统。这两套系统是为 Grace Blackwell 创造的。

而今天,Nvidia 是全球最大的网络公司。我为网络团队感到无比自豪。这是我们所做一切的最强大推动力。

过去CPU为人类设计,如今智能体工作在

纳秒级世界,需要极致低延迟和高交互性

Vera CPU是为智能体而生的处理器

接下来我要谈我们将要进入的下一个重要产业,我们来谈谈 CPU。

让我们来谈谈 CPU。Vera——为 AI 时代而生的 CPU。

迄今为止,所有 CPU 都是为人类创造的。我们是用户,我们是租户。我们使用 CPU 的方式——我们生活在以秒为单位计量的世界里。我们在云端租用 CPU 的方式——CPU 核心越多,能租出去的越多。

旧 CPU 的经济模式和使用方式,与智能体的需求根本不同。智能体是没有耐心的。它们不生活在以秒为单位的世界里,它们生活在以纳秒为单位的世界里。

当它使用一个工具时,它需要响应时间尽可能短。当它访问数据库时,必须尽快返回结果。智能体每等待一刻,就少走了一步。让 CPU 尽可能低延迟、尽可能高交互性至关重要。

所以我们为 AI 时代创造了 Vera CPU。

图片

在我们的系统里,Vera CPU 有三种使用方式——实际上是四种。

第一种,当然是 Vera Rubin 负责"思考"。

Vera Rubin 机架内部已经有两颗 CPU。如你们所知,我们正在生产并销售数百万台 Vera Rubin。我们已经卖出了数百万台 Grace Blackwell。Nvidia 已经是全球最大的 CPU 制造商之一了。

在 Vera Rubin 机架里有两颗 CPU:

一颗用于协调和管理 GPU、管理 KV 缓存、处理机架内运行的所有软件;另一颗是 Grace BlueField,用于安全和隔离。

Vera 计算 CPU 用于框架、AI 模型的协调调度、工具使用、数据库访问。而数据服务器就在这里——Vera BlueField——全世界速度最快的存储服务器、最快的存储系统。这之所以如此关键,是因为智能体访问内存的速度极其惊人。

这些系统——存储服务器和 CPU——现在是数据中心最昂贵部分的关键路径。之所以最昂贵,有充分的理由:AI 工厂的经济学基础就是 token,而 token 就在这里被创造出来。所以当然你希望尽可能多地生产和生成 token。这里是你投入全部经济资源的地方,而它必须不能成为瓶颈。

因此,Vera CPU 承受着极大的压力——对 CPU 架构的压力——这就是为什么我们从零开始构建了一个全新的架构,一个世界从未见过的 CPU。我们叫它 Vera。

Vera的四大特性:极致单线程性能、

顶级每核带宽、超高总带宽、极致能效

在真实单线程性能上实现了巨大提升

这是为智能体而生的 CPU。以往所有的 CPU,我们是为人类而建的。这颗 CPU,是为智能体而建的。

有四个关键要点。

第一个要点:Vera 的每时钟指令数(IPC)必须极其出色,因为我们需要延迟尽可能短。单线程性能——不是吞吐量,是单线程性能——必须是世界顶级水平,是绝对最好的单线程性能。这就是为什么 Vera 的 IPC 如此之高,是全球最高的。每个时钟周期取址、译码并执行 10 条指令。

第二点:CPU 数据进出所需的带宽必须是绝对的世界顶级。这是每核带宽。

第三点,就是纯粹的带宽——总带宽。我们要移动——记得我之前说过,Agentic 系统从根本上是去中心化和分布式的。当计算去中心化和分布式时,网络互联就成了问题所在。

因此,我们必须在 CPU 核心之间、CPU 与存储之间、CPU 与 GPU 之间,尽可能快速地移动数据。系统内部和 CPU 核心内部的带宽必须是绝对的世界顶级水平。

这是很久以来第一颗真正达到光刻极限的 CPU——用一个连接所有 CPU 核心的互连架构,以光速运行:3.6 TB/s。没有多芯片堆叠,没有跨芯片边界。因为 CPU 核心之间需要以极高带宽相互通信。它们不是按核出租的,它们全部协同工作。

Vera 的截面带宽高得离谱。它是第一颗支持 PCIe Gen 6 的 CPU,也是第一颗支持 LPDDR5 DDR5 的 CPU,带宽高达 1.2 TB/s——是市面上最高性能 CPU 的两到三倍带宽。内部带宽是外部的三倍,每核带宽和总带宽都是世界顶级。

现在记得我之前展示的——CPU 核心数量、CPU 的数量将会非常可观。

原因非常简单。我们以前为人类制造 CPU,而人类只有约 10 亿在积极使用计算机。而智能体将有数十亿个。这些智能体使用 CPU 时没有耐心,因为它们旁边 GPU 的成本太高、太宝贵。

因此,这些 CPU 既需要高性能,也需要极高的能效——这样我们才能在工厂里塞下尽可能多的 CPU,又不从 token 生成中抢走电力,而 token 生成才是我们赚钱的方式。

这四个特性——每时钟指令数(即单线程性能)、每核带宽、芯片内外总带宽,以及能效——定义了 Vera。与最高性能的 x86 相比,它绝对是世界顶级。在真实单线程性能上,简直不在一个维度。

能在 CPU 上实现 5% 的提升,就已经很了不起了;10% 的提升,同样了不起。但这种幅度的性能提升,闻所未闻。

这就是 Nvidia Vera。你们觉得怎么样?

图片

【产品介绍视频】— Vera CPU 架构

“Agentic AI 改变了 CPU 的角色。CPU 现在是指挥家,GPU 是管弦乐团。

传统 CPU 是为另一个时代而建的——最大化每插槽核心数,切分、虚拟化,按小时出租。而在智能体时代,CPU 已成为 GPU 利用率的瓶颈,直接影响 token 吞吐量、延迟和用户体验。

Nvidia Vera 是为 Agentic 循环而生的 CPU——将 Nvidia 自研的数据中心 CPU 核心与可扩展一致性互连(SCF)相结合,在性能、核心数和带宽之间取得恰当平衡,以最大化 AI 工厂产出。

图片

Vera 的核心是 Nvidia Olympus Core,专为现代数据中心工作负载而构建:分支密集的 Python 运行时、工具调用和沙箱代码执行。每颗核心都针对吞吐量进行了调校。神经分支预测器,每个时钟周期评估两条预测分支。

10 宽解码引擎,每个时钟周期引入更多工作。大型乱序执行引擎,保持指令持续流动。配备新型图引擎的高级预取器,预判下一条数据路径。

但核心再快,数据必须正确、及时到达才有意义。Vera 是第一颗使用 LPDDR5X 内存的 CPU,能够在不损失带宽的情况下同时纠正多个错误。相比 x86,Vera 实现了 40% 更低的峰值内存延迟——在检索分析和沙箱执行过程中,始终保证核心的数据供给。

Nvidia 第二代可扩展一致性互连,将所有 88 颗 Olympus Core 统一在单片 Mesh 上,内存和 I/O 采用独立芯片。核心不会跨三芯片组分割,实现了比传统 CPU 快 50% 的核间通信。

内存一致的 NVLink 芯片间互连,将 GPU 直接连接到互连网络。在 GPU 之外,NVLink 芯片间互连还能将 Vera 扩展到多个插槽,实现 CPU 之间的超大带宽。

Vera 的 Agentic 沙箱性能是 x86 CPU 的 1.8 倍。独立 Vera 机架运行智能体沙箱、工具、代码和数据管道,与 Rubin GPU 紧密耦合,Vera 保持加速工作流持续运转。

Nvidia Vera BlueField 4 STX 驱动上下文内存与 AI 存储——计算、网络、存储三位一体。Vera,为智能体时代而生的 CPU。”

这将是我们新的主要增长驱动力。评测已经陆续出来了,都非常好。真的很厉害。

Vera是专为Agentic系统设计的全新CPU

SQL查询速度提升3倍、实时流处理速度提

升6倍,将开辟一个全新、更大的市场
还要记住,Grace 和 Vera 也是 AI 领域资质最完备的 CPU——因为每一个数据中心、每一朵云、每一家企业,每一家与 Nvidia 在 AI 上合作的公司,都已经对 Grace 完成了适配认证。整个软件栈都已经针对 Grace 进行了优化。每家公司都将对 Vera 进行认证。

Vera 将成为全球最优化的 Agentic CPU,原因很简单:它将随 Vera Rubin 一同出货,原因是我们做出了这个艰难而重要的转变。

事实上,在 Grace Blackwell 的过渡期间,最大的风险就是从外部的 x86 CPU 迁移到 Grace Blackwell。那次迁移极具风险,但我们以令人叹为观止的执行力完成了它。

现在,Grace 已经和 Grace Blackwell 画了等号。人们说 Blackwell,就是在说 Grace Blackwell——因为它现在已经无处不在了。每家公司的软件栈都已针对它优化,每家公司的安全栈都已针对它优化。

现在,Vera 来了。我对此无比兴奋。

图片

来看看一些性能数据。

速度提升是一方面。要给 SQL 提速极其困难。SQL 是有史以来最著名的领域特定语言——你知道,在 CUDA 之前有 SQL,在 OpenGL 之前有 SQL——SQL 由 IBM 发明,今天是整个地球的结构化数据库引擎。

人人都在用 SQL。这是 SQL 运行速度提升三倍——不是提升 10%,不是提升 25%,是三倍速度。令人难以置信。

下一个是实时流处理。记住,你的 AI 将不只是在读文档。你的 AI 将在监测遥测数据——尤其是工厂内部、股票交易所内部。你将持续监测遥测数据。

涌入的数据洪流进入 CPU。这是 Vera CPU 运行实时流处理的表现。纽约证券交易所的 Lynn Martin 总裁非常慷慨地与我们开展了合作。

这套系统在全球实时运行。流处理方面,Vera CPU——快了六倍。全都来自于带宽、单线程指令执行效率、核间内部带宽,以及外部带宽。Vera 是彻底的革命。

你知道,X 倍的提升,通常是在谈 GPU 时才会提到的。在与 CPU 相关的真实工作负载上谈 X 倍提升,实属罕见。我为这个团队感到无比自豪。你们做得太出色了。

我们有非凡的路线图即将到来。但真正令人兴奋的是,几乎所有人都像我们一样对 Vera 充满热情。Vera 正在打开一个全新的市场,一个以前从不存在的市场。

Agents(智能体)是一种新的工作负载。以前我们为人类制造 CPU,现在我们需要为智能体制造 CPU,为 Agentic 系统制造 CPU。它们的特性要求是不同的。为什么旧 CPU 还能适用?我们正在生产数以百万计的 Vera。

与我们携手开拓市场的:台湾的 ODM 和计算机制造商,以及所有 OEM 厂商。你们可以看到,早期采用者正是那些 Agentic 公司。

这是一个新市场的开端,一个以前从未存在过的市场。它不会侵蚀旧市场——但这是一个全新的市场:为智能体而生的 CPU。而且这个市场一定会比上一个更大。原因很简单——智能体的数量将远超人类。而且智能体非常没有耐心。

所以,Nvidia Vera CPU——谢谢大家。

与微软合作推出RTX Spark,标志着PC进入全新“智能体辅助计算”时代,PC将像当年的手机一样被彻底再发明,未来每栋房子都可能拥有一台AI超级计算机

Nvidia企业AI智能体工具包,针对企业构建

“智能体即服务”而推出,包含四大核心组件:

模型、框架、工具与技能、运行时OpenShell

这是最重要的一张幻灯片。要传递的核心信息是:这是未来十年的应用模式,也是计算模式。

图片

智能体与框架,协调编排大语言模型。每家公司都将运行它。每家公司都将成为智能体公司。每家公司内部都将运行智能体。每家公司都将看到,智能体需要自己的操作系统。

每家公司都在问我们:"我们怎么安全地运行智能体?我们怎么为自己的工作负载构建智能体?"因此,我们推出了 Nvidia 企业 AI 智能体工具包。

图片

你们一直看着我把这一切构建在大家眼前。Nvidia 做的几乎每一件事——如果你回头看我五年前或十年前的 GTC,你就会看到今天这一切。你们已经看我谈论这些好几年了,因为我们一直在为这一刻而构建。

企业要构建"智能体即服务"或运营智能体,需要四样东西:

第一:模型——大语言模型。越智能越好,越便宜越好,越快越好。

第二:需要一个框架来协调整个系统。

第三:这些模型想要使用工具。这些工具带有各自的技能(skills)。我向你们展示了 CUDA X 库——那些将来会是智能体的惊人工具。

第四:需要一个运行时——把一切粘合在一起的操作系统。

这就是 Nvidia 智能体工具包。它包含可供修改的模型——Nvidia 的世界级开放模型。你可以运行任何人的智能体——Claude Code,出色的智能体;Codex,出色的智能体。你可以在叫做 Open Shell 的框架里运行它,它对企业内部使用具有极高的安全性。

Shell 保护智能体,使其受安全策略约束,隐私受到保护,权限和权利得到赋予,身份受到保护。这个 Open Shell 正在全球范围内被广泛采用。Nvidia Open Shell 是开源的,你将看到非常多公司采用它——Red Hat、Canonical、微软,它将在各处被采用。

这就是运行时。这个运行时完全针对 Nvidia AI 平台进行了优化,而 Nvidia AI 平台无处不在。所以你可以在任何云、本地部署乃至设备端运行 Open Shell。

于是你有了智能体可以使用的工具和库,有了可以修改或直接使用的模型,还有了智能体本身——OpenClaw、Hermes,另一个出色的框架。这些 Agentic 框架现在可以在本地部署或在任何地方运行。

好——四样东西。而这代表了现代企业的操作系统。

Cadence×Nvidia芯片设计超级智能体:

验证周期提速40倍以上,重新定义芯片工程

那我们如何使用它?我最喜欢的智能体应用场景之一就是芯片设计——那是 Nvidia 做的最重要的事情。

所以我们当然要与 Cadence 合作,构建超级智能体——芯片设计超级智能体。它由 Codex 或 Claude Code 协调,以 RTL、架构图、原理图或规格书作为输入,以及任何需要修复的内容。

我们共同创建了一些针对 Nemotron 优化的超级智能体,运行在 Nvidia 运行时上。我们来看看——真的令人难以置信。

图片

【产品介绍视频】— Cadence × Nvidia 芯片设计智能体

“Cadence 与 Nvidia 正在合作构建芯片设计智能体。

数十万颗 Nvidia 芯片汇聚在一起,组成了驱动全球前沿 AI 模型的 AI 工厂。

设计这些芯片及其运行的系统,是最艰难的工程挑战之一。数万亿个晶体管,三维电路,微米级别,每一个门电路、每一根导线都必须精确到皮秒——在毫无误差的条件下完美协作。物理原型太慢也太昂贵,工程师们在数字世界中作业。

每颗芯片始于一套架构规格,然后被翻译成 RTL——芯片设计的语言。RTL 必须通过仿真验证,一个 bug 就可能让芯片延期数月。

在 Nvidia:数千名工程师,每年数十亿计算小时,数百万个测试被编写、运行和调试——这个循环往往让团队耗费数周。

为了压缩这个循环,Cadence 与 Nvidia 共同构建了一个设计验证智能体。Codex 负责协调整个流程。Cadence Chipstack 启动 RTL 验证循环,由 Nemotron 驱动、Nvidia Open Shell 保护——调用 RTL 生成、测试台创建、回归测试和调试等方面的专家子智能体。

系统自主驱动。Chipstack 智能体用 Cadence Xcelium 运行数百次仿真,用 Jasper 进行形式验证,设计缺陷被揭露、代码中的 bug 被修复。曾经需要数周的工作,如今只需数小时。验证周期——提速 40 倍以上。"

图片

Nvidia 与 Cadence 携手,用 AI 智能体重新发明了芯片设计——从数周缩短到数小时。

Nvidia 有数千名芯片设计师。我们要雇用数十万个 Cadence 超级智能体与我们共事——让我们能够加速公司的节奏,让我们更有雄心,创造更精彩的事物,跑得更快。

图片

你们刚才看到,这个工具包——模型、框架、工具(在这里是 Cadence 的仿真器、验证工具、形式验证系统)——这就是为什么我们如此努力地与 Cadence 合作,加速他们所有工具在 CUDA 上的速度。

因为智能体没有耐心。智能体要立即得到答案。所以,模型、框架、加速的 CUDA 库与工具,以及运行时——你们刚才看到的,正是这一切汇聚的成果。

推出下一代高智能开放模型Nemotron 3

Ultra,5倍速度+30%更低成本,全面开

放,助力专属超级智能体

这一切始于一个出色的模型——Cadence 可以修改和调优它,使其成为 Cadence 工作流、Cadence 专业知识方面的专家,从而创造出具有 Cadence 专有知识产权的超级智能体。他们需要从一个出色的模型起步。我们称之为 Nemotron。

Nvidia 致力于为世界构建开放模型,让你们所有人、让我们所有人都能创建自己的智能体。

今天,我们宣布推出 Nemotron 3 Ultra——我们的下一个开放模型。而且它非常智能。

Nemotron 模型不只给你模型本身,我们还把训练该模型所用的全部数据一并开放。而且,由于我们拥有一个由出色合作伙伴组成的联盟——你们可以看到所有合作伙伴——我们一起合作、相互贡献数据。

Nemotron 是在全球规模最大的长程推理、长程工具使用、任务解决、工具调用数据集之一上训练的,正是因为我们所有出色的合作关系。所有这一切——模型、训练脚本和数据——全部向你们完全开放。

这是开放模型的最佳典范,是全球最优秀的开放模型体系。简单的目标:让你们能拿走所有这一切,在其基础上添砖加瓦,让它变得更好,让它成为你们自己的。

Nemotron 3 Ultra 速度快了五倍。这是全球第一个基于 SSM(状态空间模型)与混合专家模型混合架构的模型。这种架构极其快速。我们让它快,是为了让你能快速思考。快速思考,意味着相同成本下可以思考更长时间。

所以速度快了五倍。成本也低了 30%——与全球最具成本效益的模型相比,总 FLOP 数和总推理时间低了 30%。我们在与全球最好的开放模型进行比较,前沿级别的智能,快五倍,便宜 30%,完全开放。我们对此完全投入。

这就是 Nemotron 3。我们目前正在研发 Nemotron 4。

Vera Rubin全面量产,Vera CPU专为

智能体时代设计,Nvidia Agentic企业

AI工具包赋能每一家企业构建智能体

这整个工具包——模型、框架、工具与技能、运行时——是全球每一家企业现在都有能力创建自己智能体的原因,就像 Cadence 用他们的超级智能体做到的那样。

我们正在与如此之多的公司合作——Cadence、CrowdStrike、TheSoul、Palantir、SAP 和 ServiceNow。

人们总是说:"Jensen,智能体会颠覆这些市场。"

我说:恰恰相反。而你们现在可以看到了。智能体将为我的合作伙伴和朋友们创造有史以来最大的机遇。我们有 Nvidia Agentic 企业 AI 工具包来帮助他们。

所以:

  1. Vera Rubin 全面量产。

  2. Vera CPU——为新一代、为智能体而生。

  3. Nvidia 企业 AI 工具包——让每一家企业和每一家企业软件公司都能构建智能体。


宣布微软与Nvidia的重大合作,重新定义PC

的操作系统架构:旧OS+LLM=新操作系统,

应用程序将被Agentic运行时取代


我和你们的渊源始于此地,你们中的很多人——很多我在台湾的朋友和合作伙伴——你们的公司也始于此地。这在很多意义上,是现代计算机产业的起点。

四十年了。它已经 33 岁。那时,PC 产业刚刚开始腾飞:Windows 1、Windows 2、Apple 1、Apple 2。等我们来的时候,Windows 3.1 就是 PC。如你们所知,Windows 95 让 PC 变得"个人"了——它把 PC 从企业和公司带到了消费电子设备的层面。每个人都应该拥有一台,而现在每个人都有了。

这就是起点。这个计算平台做了几件极其聪明的事情。Windows 不只是去中心化的,如你们所知——Windows 是被恰当地抽象化的,被设计得恰到好处。系统总线,开放的芯片组。操作系统带有可以在运行时连接和安装的驱动程序。以及一个多媒体 API 抽象层,让 PC 向我们今天所知的样子开放。这些要素中的每一个,都是让 PC 如此普及的必要条件。

40 年后,微软和 Nvidia 将要重新发明 PC。这将是新的 PC。明天晚上——我想我们时区是明天晚上——我将与 Satya 一起出现。我们将更多地谈论过去三年来微软与 Nvidia 共同完成的工作。

图片

花了这么长时间,彻底重新发明 PC 的工作方式,才让我们准备好迎接这一刻。就像我之前提到的,那个叫做"智能体"的计算模式——它将在 AI 云中运行,在企业内部运行,也将在你的 PC 上运行。

当那台 PC 拥有了一个自主智能体——一个帮助你、理解你的智能体——会发生什么?你可以跟它说话,它可以看到你,你可以让它读文件、去帮你做研究,它能做的还远不止这些——我来展示给你们看。

新的操作系统,当然是旧的操作系统加上大语言模型——在很多方面,它是现代版本的 DirectX。它有输入输出,能理解提示词,能理解计算机视觉,能生成视频,能生成声音。它是 PC 的现代延伸,是智能延伸。在此之上,应用程序——就像我之前提到的——将被 Agentic 运行时所取代,那才是现代应用程序,是智能体。

现在来看看它能做什么。

图片

【产品介绍视频】— RTX Spark 与 N1X 芯片

“一切始于一个灵感——一个重新构想 PC 的想法,这是 40 年来的第一次,为 AI 时代而生。

在智能体原生运行的世界里,我们的个人电脑会变成什么?连接本地或云端模型。个人 AI 在沙箱中保障安全。持续运行,完成工作。芯片和操作系统都必须进化。

图片

隆重推出 RTX Spark——我们 33 年学习积累的精华,凝聚于一颗芯片。Blackwell RTX GPU,6144 个 CUDA 核心。一 PetaFlop 的 AI 算力。与联发科联合开发的定制 20 核 Grace CPU,通过 NVLink 融合。128 GB 统一内存。台积电 3 纳米制程。700 亿个晶体管。以及与微软的深度合作——一个面向智能体的 Windows 平台。

我们正在重新发明个人电脑——为创作,为游戏,为智能体。这是新一轮个人计算革命的黎明。一切从 Nvidia RTX Spark 开始。”

图片

就是它。当然,我必须向你们展示最美的部分——电子游戏。这也是最贴近我们内心的。这是《Forza》赛车。这是新的《双面特工 007》游戏,顺便说一句,我很期待玩它。我看起来有点像他。

图片

女士们先生们,Nvidia RTX Spark 笔记本电脑。

RTX Spark让开发者、创作者和普通用户

都能在个人电脑上运行强大智能体,标志

着PC进入全新“智能体辅助计算”时代

好了,这是全世界有史以来制造出的最令人惊叹的芯片。这是我们与联发科联合开发的 N1X。我想我之前见到了 Rick——这就是 N1X。

这是一颗美丽的芯片。这颗芯片,坦率地说,需要 33 年才能构建出来。原因在于,Nvidia 软件栈的 100% 都可以在这上面运行。想做数字生物学——没问题。想做地震处理——没问题。想做天体物理学——没问题。一切与 CUDA 相关的:所有物理、所有生物学、所有基因组学、所有 AI——没问题。所有计算机图形学——没问题。

Nvidia 有史以来创建的每一个应用程序,以及 Windows 有史以来运行的每一个应用程序——微软和 Nvidia 精心优化了所有这一切,使这台电脑字面意义上运行人类有史以来创造的所有东西。而且,它现在还能运行智能体。一台令人难以置信的电脑。我为此感到无比自豪。

好了,现在请记住这一点。在下一个视频里,我只是想向你们展示——想象一下,这里展示的所有内容都将在你的 PC 上运行。

那台电脑可以有一个本地运行的 Nemotron 3 Ultra,或 Nemotron 3 超级模型,或者可以使用云端的 Claude Code 或 Codex,或其他某个云端模型——然后它将完成一些令人惊叹的事情。

我们来播放视频。

图片

【产品介绍视频】— 在 RTX Spark 上运行智能体辅助建筑设计

“每栋房子都始于一个构想。从构想到设计,需要大量的工具、专业知识和时间。

现在,一个在 RTX Spark 上本地运行的智能体,可以帮助我在笔记本电脑的工具上设计一栋房子。

在 Open Shell 沙箱中运行 Hermes 框架,连接到云端的 Claude Sonnet——我选定地块,分享我的概念草图和风格情绪板来激发设计灵感,并输入提示词:一段描述需求和设计意图的文字。

我的智能体开始工作,使用我笔记本上的工具。它打开 Rhino,开始建模地块——塑造地形、退线和建筑体量包络线。然后它提出针对成本、舒适度和品质优化的建筑形态方案。

确定形态后,我的智能体生成室内布局——墙体、流线、房间开始成形。我可以随时介入调整,门窗和结构构件自动就位。我的智能体会自己发现错误并修正。

经我确认后,智能体将模型从 Rhino 导出到 Blender,材质和对象属性连同设计上下文一并迁移。我微调材质,调到满意的效果,然后选取镜头。Blender 渲染房屋,我的智能体使用 Flux 2 模型的生成 AI 将渲染图做成照片级真实效果。多个视角,多种光线条件。

曾经复杂的工作流,现在由我在 RTX Spark 上运行的智能体引导和简化。以想象的速度完成设计。”

你看——在智能体的世界里,开发者们对此兴奋无比。这是一台令人难以置信的电脑,拥有所有的加速能力和软件能力,与每一位开发者合作,让它对你们所有人来说都极为出色。

下一个——Adobe 出色的创意套件,当然已被全球数千万人使用。他们重新设计了 Adobe Photoshop 和 Premiere 的架构和核心,并将为 RTX Spark 发布新版本。速度快了两倍。本来就已经很快了——现在要快两倍。而且它还被设计成对智能体友好的——通过 MCP 服务器,它现在可以与你笔记本上的智能体交互。

有那么多合作伙伴对把 RTX Spark 推向市场充满热情,令人难以置信。这是 40 年来首次覆盖整个 PC 产品线的重新发明。

我非常高兴全球的你们和整个生态系统加入了我们。这基本上是全行业都在支持 RTX Spark,我们将与所有人共同构建出极其智能、强大而美丽的笔记本电脑。非常感谢大家。

PC将像当年的手机一样被彻底再发明

未来每栋房子都可能拥有一台AI超级

计算机,全天候运行个人智能体


但这还不是全部。RTX Spark 重新发明了笔记本电脑。但事实上,微软和 Nvidia 正在重新发明整个 PC 产品线。


今天,我们宣布推出全新的三款革命性 Windows 机器,涵盖台式机、笔记本电脑和工作站。全部 100% 兼容 Windows。100% CUDA。100% Nvidia AI 张量核心。

全球在所有这些不同平台上在 Nvidia 上运行的一切,在这里也都能运行。这是 40 年来发生的第一次彻底重新设计和重新发明的 PC 产品线。

让人真正惊叹的是这个。这是 RTX Spark 笔记本,这是来自 MSI 的台式机。看看它有多美。

这个智能体可以 24/7 全天候免费运行——你好,你的智能体。你可以在这里运行它。这是你的时钟,它一直在运行,没有计费计时器。连接到你的整个家——连接到你的笔记本、显示器、所有摄像头、烘干机、饮水机、热水器,你的一切——只要你想要,你的安全系统——全都连接上。这就成为你的私人 AI 智能体。

它会随着时间越来越聪明,因为今天我们有 Nemotron 3 Ultra,明天有 Nemotron 4,然后是 5、6……我们就这样不断变得越来越聪明。与此同时,它坐在家里帮你做事。如果你想订行程——没问题。

如果你想要一台令人难以置信的系统,这是 DGX Station 4——与 Windows 完全兼容,运行 Windows 下的所有东西——它有 768 GB 内存,你可以运行一个万亿参数的模型。这令人难以置信,20 PetaFlops,8 TB/s 的内存带宽。

这就放在你的桌边。如果你是大语言模型的开发者,如果你是智能体的开发者——有这个放在桌边,你就拥有了所需的全部算力。然后当你部署时,再放到云端去。

现在,如果你看着这个并思考一下,会发现某些事情正在发生。记得 15 到 20 年前,我们有一个叫做"手机"的概念,今天我们有一个叫做"PC"的概念。

而今天,当你想到你的手机时,你唯一不用它来做的事情就是打电话。你用它做几乎所有其他事情。所以那部"手机"对你的意义,和过去的手机根本不同。

图片

我非常确信,将要发生的事情是:十年后的 PC,和你今天认为的那台工具——你在上面打开应用程序,点击和打字——将会完全不同。

这是我的理论。我完全可以想象,就像今天每栋房子都有家庭影院——很多房子有大屏电视、割草机、洗碗机——我完全可以想象,有一天每栋房子里都会有一台 AI 超级计算机。它运行你所有的智能体,运行你所有的助手,全天候为你做各种各样的事情。就像你家有家庭影院、有立体声音响、有游戏机一样——你的家里会有 AI 智能体计算机在运行。

而它,假以时日,在你心目中会越来越像 R2-D2,越来越像 C-3PO,而不再像一台 PC。

毫无疑问,这次计算机的再发明,与智能手机对手机的再发明一样意义深远。这就是这段旅程的起点。

这是一个新产品线的开始。我们有这方面的路线图——这对我们来说是全新的产品家族。每一代架构,我们都会有台式机、笔记本电脑和工作站。

让我感到无比欣慰和无比荣幸的是,全球 100% 的 PC 行业都加入了我们,共同重新发明 PC。新产品线,新起点。谢谢大家。


发布Cosmos 3模型、Alpha Mayo 2模型;AI的下一个飞跃是通用人形机器人,Isaac Groot旨在成为机器人领域的“参考平台”

发布Cosmos 3,物理AI的前沿开放全能

模型,采用全新混合Transformer架构,

拥有VLM、世界模型、仿真器等多重能力


如你们所知,Agentic AI 就是一个数字机器人——它理解、推理、规划、行动并使用工具。Agentic AI 将在所有这些计算机上运行。你们已经看我谈论过其中的每一种。


随着时间推移,我们在做各种各样的人形机器人计算机,做自动驾驶汽车计算机,做卫星相关工作。你们有搭载张量核心的 GForce,我刚刚谈了全新的 PC 产品线。


农业设备、制造设备、重工业设备——都将是 Agentic 的。你甚至会有一个小型 Agentic 助手为你自己服务。即使是基站——未来的无线电台也将是 Agentic 的:理解流量、思考如何与其他基站协调,以尽可能少地使用能源,提升利用率、提升频谱效率。一切都将运行智能体。


今天,Nvidia 很大程度上处于中心位置。但我非常确信,将会有数百亿——随着时间推移达到数千亿个——Agentic 系统、Agentic 计算机在全世界运行。

最大的问题是数据。对于语言模型来说,互联网上的所有英语和所有语言——我们训练用的数据——都是从我们人类的视角出发的:是我们写下的,是我们阅读的。

然而,为 AI 机器人创造训练数据,必须从机器人的感知视角出发。而世界上大多数视频数据是第三人称的,不是第一人称的。所以,对于 Agentic 系统、机器人系统、物理 AI 来说,数据是最难的问题。

你们看到我们沿着这条路走来。我们从遥操作开始——本质上是人类示范。这和强化学习人类反馈的重大突破没有什么不同。然后我们使用仿真。

这就是 Omniverse 的用武之地——这和使用可验证奖励的强化学习没有什么不同。于是我们用这些系统来引导、启动 AI 模型,即物理 AI 模型。最终,我们能够从第三人称视频中学习,重投影为第一人称。

而现在,通过一步步的引导,我们有了一个世界基础模型,它能够从你想要的任何视角理解物理世界——第三人称、第一人称、由外而内、由内而外,都没关系。这确实是一个重大突破。

今天,我们宣布推出 Cosmos 3——物理 AI 的前沿。在语言模型领域,我们处于前沿,而且有那么多人在从事这方面的工作。然而,在物理 AI 领域,我们绝对是全球最好的。我为团队完成这件事感到无比自豪。这是你们所有工作的基础模型。

无论你想创造什么样的机器人——工厂机器人,在工厂里工作的机器人,任何涉及物理世界的机器人——你现在都有了一个伙伴 Cosmos 3,它能理解和推理,能够生成,能在循环中仿真,甚至可以本身就是策略。它在全球各地的排行榜上位居榜首。我为 Cosmos 感到无比自豪。

今天,我们宣布推出 Cosmos 3。我们来看看。

图片

【产品介绍视频】— Cosmos 3:物理 AI 基础模型

“真实世界是无限且不可预测的。物理 AI 需要数据,但真实世界的数据无法大规模获取。对于物理 AI,算力就是数据。

这就是 Cosmos——一个面向物理 AI 的开放前沿全能模型(Omni Model)。基于全新的混合 Transformer 架构构建。像素、动作、声音和语言流入自回归 Transformer,它负责推理、规划并指挥扩散 Transformer,后者生成接下来将发生的事情。

开发者可以在不同实体形态和应用场景上对 Cosmos 进行后训练。

作为 VLM,Cosmos 观察物理世界,理解正在发生的事情,描述场景并标记关键内容。

作为世界模型,Cosmos 从图像、文本或视频生成物理精确的合成视频。

作为仿真器,Cosmos 为策略训练和评估闭合循环。

而作为 Nvidia Omniverse Dreams 的基础——一个动作条件世界模型——Cosmos 逐帧预测未来。对 Cosmos 进行后训练,它就成为了世界行动模型:感知、推理、规划,为各类机器人、为一切运动的事物生成行动。

一种新的数据,一种新的教师,由算力生成。Cosmos——物理 AI 时代开发者的基础。”

数据加算力得到 AI。现在我们有了 AI,算力就是数据。所以用 Cosmos 来训练大量的 AI 模型。

Cosmos 是一个如此出色的开放模型体系——与 Nemotron 完全一样:我们开放模型,开放数据,我们甚至开放了我们如何训练它,这样你就可以对其进行增强,并把 Cosmos 变成你的专有模型。

我们在如此多的不同行业都有出色的合作伙伴与我们共同工作。

推出面向自动驾驶的开放模型Alpha

Mayo 2,Nvidia Hyperion已签约

品牌覆盖全球约80%的汽车产量

当然,模型本身是 AI 技术栈中最容易理解的部分。但 AI 技术栈非常复杂——它有生成器、模型、仿真器和运行时,就像 Agentic 系统一样。

这些汽车本质上就是物理 AI——一辆作为自主驾驶车辆的 Agentic 机器人,同样拥有这个复杂的技术栈。

今天,我们宣布推出 Alpha Mayo 2——一个面向自动驾驶汽车的开放模型。

我们正在与全球各地的汽车公司合作。如果你看看这些已经签约 Nvidia Hyperion 的品牌——正在制造 Nvidia Hyperion 汽车的品牌——这代表了全球约 80% 的汽车。这些制造商代表了全球 80% 的汽车产量。我们将拥有大量能够运行 Alpha Mil 或任何其他人自动驾驶技术栈的 Nvidia Hyperion 系统。

我们还连接到了出行服务。全球约 97% 的出行服务正在与我们接入合作。所以,当我们在 Hyperion 运行时和 HALOS 操作系统上部署 Alpha Mayo,我们将能够连接到全球所有这些服务。

我们来看看这个。

【产品介绍视频】— Alpha Mayo 2:自动驾驶演示

图片

【一辆梅赛德斯车辆在城市环境中行驶,AI 实时播报其推理过程】

“正在规划前往目的地的路线。车道畅通。

拉出停车位开始行驶。

由于前方停止的车辆阻挡我们的车道,向左微调。

减速在十字路口控制方向的停车标志前停车。

停车让行人通过。由于有人在我们车道上,让行从左侧切入的车辆。

向左微调,避开右侧阻挡的停止车辆。

与切入车辆保持距离,因其正在并入我们的车道。

由于停止的货车和额外的行人横穿我的车道,向左微调。

前方有人行横道——停车与前车保持距离。与正前方车辆保持距离。

在停车标志处停车,因为这是有管控的路口。

停车让行,因有骑行者正在穿越。与前车保持距离。

由于卡车阻挡在我车道左侧——向右微调。您的目的地在右侧。"

Alpha Mayo——全球第一辆推理型自动驾驶汽车。如果你让它一直说话,它会让你抓狂。但我们非常高兴它一直在自言自语——那叫做思考。Alpha Mayo 就是一个推理型 AI。

AI的下一个飞跃是通用人形机器人,

Isaac Groot旨在成为机器人领域的

“参考平台”

我们创造的这些技术也同样适用于人形机器人。当然,还有许多新的突破需要实现。

Nvidia Isaac Groot 是我们的人形机器人技术栈——数据生成、仿真、运行时,包括 AGR 系统。

无论是 Agentic 系统——云端的 Agentic 系统,PC 上的,自动驾驶汽车的机器人系统,人形机器人的机器人系统——计算模式完全相同。

而且在每一种情况下,我们都从垂直整合、完全集成的协同设计、极致协同设计着手,然后向所有人开放,让你使用你喜欢的任何部分,无论你想用什么——我们甚至帮你进行修改。

但缺少的一件事是:我们需要机器人系统的参考平台。这些机器人系统极其复杂——电机那么多,传感器那么多,如此脆弱。但我们需要有一种方式来交付这些参考平台,就像我们为 PC、DGX、云计算和自动驾驶汽车所做的那样。现在,我们要为机器人做到这一点。

今天,我们宣布推出 Nvidia Isaac Groot——一款参考人形机器人,完全集成。每只手 25 个自由度,由 Schaeffler 制造,整个机器人 31 个自由度,身高 6 英尺,体重 150 磅——和我一样。第一个数字比我短,第二个数字比我大,其他方面都差不多。

这款平台搭载全新的 Thor 处理器和我们的整个软件栈:数据生成栈、数据仿真栈、运行时——全部集成进一台专为所有人使用而设计的机器人。

我们为它而建的首批用户是高等教育机构和大学研究人员,因为让他们自己去构建这些是极其困难的事情。

我们来看看。

图片

【产品介绍视频】— Isaac Groot 人形机器人平台

"AI 的下一个飞跃是通用机器人——人形机器人。

但构建一个如此之难。每个团队都从零开始,拼凑仿真器、遥操作系统、数据流水线和训练基础设施——在研究开始之前需要数月的搭建。

Nvidia Isaac Groot——一个面向人形机器人的开放开发平台。开放模型、仿真与训练库,以及数据生成器。加上机器人计算机——完整的流水线,数小时内即可就绪。

首先,在 Isaac Lab 中建立仿真环境。用 Isaac Teleop 在真实或仿真机器人上捕获示范动作。用 Omniverse 和 Cosmos 生成合成数据,将一次示范扩展为数千次。训练策略,在 Isaac Lab Arena 中评估。通过运行在 Jetson Thor 上的 Isaac Cross 进行部署。

每个元素都是模块化的、开放的——使用我们的,或者换入你自己的 Groot。它正在驱动每个学科、每个领域的机器人研究——从研究实验室到工厂车间。一个开放平台。

以及一个新的补充:Isaac Groot 参考设计机器人——构建于 Nvidia 开放平台之上,为任何地方的任何实验室的前沿研究而生。机器人时代,从这里开始。"

Nvidia Isaac Groot——如此之多的机器人。我们正在与全球几乎所有从事机器人或机器人系统工作的人合作。

过去六个月,计算机产业因Agentic AI与前沿模型结合而彻底改变,Nvidia已转型为AI基础设施领导者,支持全场景智能体部署

图片

让我告诉你们我讲述的这一切。

在过去六个月里,计算机产业已经彻底改变。一切都因为智能体得到实现而改变——它与最新的前沿模型融合在一起,使得 AI 现在能够做真正有用的工作。

这个计算模式将一遍又一遍地重复——这个智能体的计算模式:模型,使用带有技能的工具的框架,在运行时中运行。那个运行时取决于它是在云端还是本地部署,是在 PC 上还是在机器人上。

但对于所有这些,计算模式完全相同。你会因为你的偏好而使用不同的框架,因为你的偏好而使用不同的模型,你会针对你的专有用途加以改进,你会创建超级智能体然后租给其他人,帮助他们完成工作。

这个 Agentic 平台,这个 Agentic 模式——Nvidia 有一套企业 AI 工具包。这是你们所有人与 AI 互动的绝佳方式。对我们来说,这是一个绝佳的增长机遇。

Vera Rubin 全面量产。Grace Blackwell 是为处理 AI——特别是推理——而创造的;Vera Rubin 是为运行智能体而创造的。它已经全面量产。它远不只是一颗 GPU——它是一个完整的、去中心化的、分布式的智能体处理系统。

Nvidia 真正已经成为了一家基础设施公司。不只是 GPU 公司,不只是系统公司,而是一家基础设施公司——帮助你们实现最大的营收、最大的利润,并尽快到达那个目标。

智能体世界——这种全新的计算方式,你为智能体而非人类构建 CPU,为智能体而生的 CPU——有其特殊的需求。而我们的 Nvidia Vera 是革命性的。我对它的量产爬坡无比高兴。订单已经显示,它将成为我们公司历史上最快、最成功的产品发布。

Nvidia 和微软共同创造了全新的 PC 产品线。这是一个新的起点。当然,我刚刚描述的这个 Agentic 处理模式、计算模式,也将在各种设备上运行。

我提到了 PC,但未来将会是机器人、卫星、基站、工厂——在云端、在本地、在边缘——这个 Agentic AI 系统、这个 Agentic 计算模式将在全世界的计算机中复制。我们对个人计算机的认知,很可能将会彻底改变。

我想感谢你们所有人的合作与友谊。没有我们共同完成的一切,我们不可能走到今天。我为你们在过去这一年取得的巨大成功感到无比自豪。明年——将会更多。

我还有最后一件事要给你们看。我们来看看。

[结尾特别表演节目]

图片

图片

图片

图片

图片

图片

感谢这非凡的一年。感谢你们所有的友谊与支持。谢谢大家,保重,Computex 愉快!

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

举报

评论

empty
暂无评论
 
 
 
 

热议股票

 
 
 
 
 

7x24