“英伟达Inside”,黄仁勋与纳德拉最新对话

格隆汇06-03 15:27

1991年,英特尔做了一件在当时看来有些奇怪的事:它开始花钱贴补PC厂商,条件只有一个——在电脑外壳上贴一枚小小的Intel Inside贴纸。

这个决定改变了整个PC产业的权力结构。

那枚贴纸是品牌案例绕不开的经典,而背后是一套精心设计的生态绑定机制用户开始认牌子买电脑,OEM厂商因此不敢轻易换芯片,软件开发者随之向英特尔架构优化,三角锁定一旦形成,英特尔就此主导PC生态长达三十年。

更大程度而言,这是一个关于“平台定义权”的故事。谁定义了PC的核心架构,谁就收取了整个产业最稳定的租金。

三十年后,这个故事正在被重写。只是这一次,主角换成了英伟达,而合作伙伴还是那家来自雷德蒙德的老朋友:微软

2026年6月1日,台北国际电脑展。黄仁勋穿着标志性皮衣走上舞台,发布了一款叫做RTX Spark的芯片。

从技术参数上看,这是一款极其激进的产品:与联发科联合研发的N1X处理器,台积电3nm工艺,Blackwell RTX GPU加20核Grace CPU,128GB统一内存,700亿晶体管,本地AI算力达到1 petaflop。

黄仁勋说,“40年前,Windows开启了PC时代;40年后,微软和英伟达将重塑PC。”

听起来就很燃。

英伟达正在做的是复制“Intel Inside”的底层逻辑,只不过这一次,锁定的不再只是CPU指令集,而是整条AI计算和开发栈。

而且规模更大,野心更远。它要绑定的不只是硬件,还包括整个AI时代的计算范式。

要知道,英伟达真正的护城河不是GPU硬件,而是CUDA,是已经运行了将近二十年、全球数百万开发者在上面训练模型、调试算法的软件生态。

换掉英伟达的GPU,意味着放弃所有基于CUDA优化的代码、工具链和工作流。这个迁移成本,让竞争对手的芯片性价比再高也难以撼动市场。

这是英伟达在数据中心建立的壁垒。而RTX Spark,是英伟达试图把同样的逻辑复制到PC端的第一步。

它的目标不只是卖出更多芯片,是让“本地运行AI Agent”这件事成为新一代PC的标准定义。

RTX Spark将搭载Windows系统,戴尔、华硕、惠普联想、宏碁等主流OEM厂商均宣布跟进,秋季开始陆续出货。

微软方面将整个Windows的Agent能力与英伟达的硬件架构深度绑定。

就在RTX Spark发布后不久,微软CEO萨提亚·纳德拉在北京时间今天凌晨举行的微软Build 2026大会上,专门邀请黄仁勋进行了一次深度连线对话。

两人从端侧谈到云侧,从RTX Spark谈到Vera Rubin超级计算机,从芯片架构谈到AI Agent的未来范式。

黄仁勋透露了一个细节:这次合作实际上起源于大约三年前,他与纳德拉的一次私下对话。那时候,两人就在讨论,能不能做一台专为AI和创作者设计的全新PC?

三年,从一次私聊到全球发布,再到主流OEM厂商集体跟进——这个周期,说明这不是一次仓促的产品决策,而是一次早有筹谋的平台卡位。

今天这场对话,也是理解英伟达与微软这场战略合谋最直接的一扇窗口。

以下,是那场对话的全文。聪明投资者(ID: Capital-nature)整理分享给大家。

纳德拉

这几天我一直在看社交媒体,也在看大家从你周末主题演讲之后都在讨论什么。突然之间,“边缘侧的不限量智能”强大的AI不再是云端的稀缺资源,而是每台设备上随时可用的基础能力,就像今天的电量和内存一样,用户不需要为每次调用付费或等待响应这个概念又重新变得非常热门。
你很早就在思考这个问题,也讲过很多次。现在,随着RTX Spark的推出,我觉得你们真正交付了一个突破性的系统,让AI可以变得更加无处不在。
也许你可以和我们分享一下,你对这个方向的愿景,以及你觉得它会走向哪里。

黄仁勋 

这件事其实要追溯到大约3年前,当时我们两个人有过一次对话。我们在聊,能不能打造一种全新的PC,它对设计师和创作者来说会非常强大,同时也会非常适合人工智能。

它需要具备足够强的处理能力,同时还要有完整的软件栈,能够和全球的设计软件、创作者软件,以及我们正在做的所有AI工作深度集成。

3年之后,我们真的走到了这里。我们做出了一颗非常了不起的新芯片,而这个系统也得到了你们为Windows打造的这些全新软件的支持。

现在,我们已经可以在PC上运行一个本质上具备自主能力的智能代理。

如果退一步想想,这意味着什么?过去30多年,或者说40年里,我们两家公司一直在合作。从当年一起发明 DirectX,到今天打造出这样一台可以运行自主系统的强大计算机,PC已经发生了非常大的演变。

PC从一个非常强大的工具,变成了一种可以被 AI 助手自主使用的工具。

也就是说,我可能正在外出旅行,手里拿着手机,我可以给自己的PC发一条消息,让它帮我完成一些代码工作,或者实现我刚想到的一个创意。它会自动启动 PC 上的工具,按照我的要求去修改、调整或者完成设计。

而且在我不在电脑旁边的时候,它还可以和我不断迭代。

我的PC变成了一个助手。当然,当我坐在电脑前的时候,它同样也会是一个非常好的助手。

所以,PC从personal computer,也就是个人电脑,演变成personal AI,也就是个人 AI。这件事真的非常令人兴奋。

看到它真正变成现实,看到它真的开始这样工作,我非常激动。

你刚才提到的Spark,拥有非常强大的能力。它有 1 petaflop 的AI性能。

这是一种我们两家公司共同推动的数值格式。它让我们能够充分利用这128GB 内存,放下可能高达几千亿参数的模型。

而几千亿参数的模型,已经是当前最前沿的水平。

我认为,PC上运行一个真正聪明、能够自主工作的助手,这一天已经到来了。

纳德拉

我也非常期待Windows登上GB300,那有点像把数据中心直接搬到了桌面上,非常令人兴奋。
说到这里,我们也可以聊聊数据中心这一端。
很显然,这一切最早是从我们一起建造第一台超级计算机开始的,那台机器是为了训练GPT模型。一路走到今天,我们已经走了很远。
我刚才也谈到了Fairwater的设计。它本质上是为Grace Blackwell 时代专门打造的,是为了把你们的系统设计能力和数据中心设计能力最大化结合起来。
现在,我们当然也在验证Vera Rubin,对此非常兴奋。也许你可以再谈一谈,在云端这一侧会发生什么,你们又是如何推动系统层面的创新的。

黄仁勋

我们的这段旅程确实非常了不起。我们一起打造了第一台AI超级计算机,那一代是基于Ampere的。

后来,Hopper取得了巨大的成功。

前两代主要聚焦在预训练。

到了Grace Blackwell,重点转向了后训练,也就是强化学习。这让我们拥有了推理模型。而这些基于混合专家架构的推理模型,既非常聪明,也非常节能,但它们需要巨大的系统来支撑。

所以我们打造了NVLink 72,让整整一个机架变成一台计算机。我们从一个节点,演进到一个机架。

今天,微软部署了全球数量最多的Grace Blackwell,也是最快、规模最大的Grace Blackwell部署。Fairwater是一个非常壮观的系统。它是一项工程奇迹,真的是非常了不起的成就。

它完全采用液冷就是它是闭环系统,基本上几乎不消耗水,而且非常环保。

它的能效非常高。我们能够把token生成速度大幅提升,同时把token生成成本降低一个数量级,相比Hopper大约提升了30倍。这是一个巨大的成就。

Vera Rubin是为另一个世界打造的。在那个世界里,AI已经是agentic的,也就是具备代理能力、能够自主行动的。

Hopper是为预训练打造的,Grace Blackwell是为训练、后训练以及推理打造的,而 Vera Rubin是为运行智能代理而设计的。

你很清楚,智能代理这种计算模式,和我们将在RTX Spark上运行的计算模式完全一样。它本质上就是同一种代理系统,只不过在云端,它的规模会大得多。

我们会同时处理数量极其庞大的智能代理,其中很多来自不同客户、不同合作伙伴。

因此,从存储,也就是长期记忆,到工作记忆,整个路径、整个代码路径都必须加密。数据在传输过程中是加密的,数据在使用过程中也是加密的。

所以我们会在机密计算领域进行真正的创新。

这整个解耦的、分布式的计算系统,你刚才也提到了CPU。Vera是一款为智能代理而设计的革命性CPU。

过去的CPU是为人设计的。我们人类比智能代理更有耐心。智能代理需要的是低延迟,这也是你们一直在推动的方向。Vera就是为极低延迟而设计的。

我们两边的团队一直合作得非常紧密。几乎在芯片tape-out很久以前,在系统真正启动很久以前,我们两个团队就已经完全对齐了。

数据中心是为Vera Rubin而设计的;Vera Rubin 也是为你们的完整技术栈而设计,并且已经集成进你们的网络、安全体系以及整个架构之中。

因此,当我们的系统从产线下来的时候,它们就已经在微软那边被架设起来了。我对这次合作真的非常兴奋。

纳德拉

是的,看到两个团队以这种接近光速的执行力推进,真的非常棒。
当然,我们做这一切最终都是为了赋能我们周围的整个生态。
你和我都经历过PC 时代、服务器时代,现在又走到了AI时代。我们一直相信,最终最重要的事情,是为每一位开发者、每一个组织创造机会,让他们能够在我们所做的工作和我们搭建的平台之上继续创造。
说到这里,英伟达也有很多软件正在进入我们的生态。比如,你们的模型会进入Foundry,你们的工具也会进入Foundry。事实上,你们的软件还会帮助我们加速很多工作负载,甚至包括数据仓库这类工作负载。
当然,Windows里面也会有很多相关能力。也许你可以谈一谈这个更广阔的愿景。因为大家经常谈某一个模型,或者某一项技术,但真正重要的是,这是一个更广、更大的机会,让人们可以在上面创造价值。

黄仁勋 

我们其实已经为这一刻准备很久了。

过去几个月发生的事情,我们两家公司其实已经一起准备了15年。过去几个月,突然之间,因为代理系统的出现,因为这些非常优秀的模型开始汇聚,AI 终于变得真正有用了。

你只要看GitHub就能看到,提交到GitHub的代码数量已经呈现出完全抛物线式的增长。过去几个月里,提交数量增加了3倍。

这清楚地说明,代理系统是有用的,它们正在做真正有生产力的工作。而且,token 现在也开始变得有利可图。

所以,一方面是AI使用量的增长,另一方面是智能代理所需要的计算量,两者叠加在一起,计算需求真的已经冲上去了。

我们两家公司一直在做的一件事,就是确保这些智能代理将要使用的所有工具,都能够被充分加速。

比如Fabric现在已经实现了全面加速。我们正在加速数据处理,包括SQL、Spark、基于语义的处理、基于向量的处理、基于图的处理。

我们要确保Azure上所有可用的工具,都能够被GPU全面加速。因为智能代理是没有耐心的。

我们越快把答案返回给智能代理,它们就能越快迭代,也就能越快生成token。而这最终也是开发者、我们双方客户真正想要的:生成大量真正有价值、真正聪明,而且能够带来利润的token。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法