“英伟达Inside”，黄仁勋与纳德拉最新对话_老虎社区_美港股上老虎

“英伟达Inside”，黄仁勋与纳德拉最新对话

格隆汇06-03 15:27

1991年，英特尔做了一件在当时看来有些奇怪的事：它开始花钱贴补PC厂商，条件只有一个——在电脑外壳上贴一枚小小的“Intel Inside”贴纸。

这个决定改变了整个PC产业的权力结构。

那枚贴纸是品牌案例绕不开的经典，而背后是一套精心设计的生态绑定机制：用户开始认牌子买电脑，OEM厂商因此不敢轻易换芯片，软件开发者随之向英特尔架构优化，三角锁定一旦形成，英特尔就此主导PC生态长达三十年。

更大程度而言，这是一个关于“平台定义权”的故事。谁定义了PC的核心架构，谁就收取了整个产业最稳定的租金。

三十年后，这个故事正在被重写。只是这一次，主角换成了英伟达，而合作伙伴还是那家来自雷德蒙德的老朋友：微软。

2026年6月1日，台北国际电脑展。黄仁勋穿着标志性皮衣走上舞台，发布了一款叫做RTX Spark的芯片。

从技术参数上看，这是一款极其激进的产品：与联发科联合研发的N1X处理器，台积电3nm工艺，Blackwell RTX GPU加20核Grace CPU，128GB统一内存，700亿晶体管，本地AI算力达到1 petaflop。

黄仁勋说，“40年前，Windows开启了PC时代；40年后，微软和英伟达将重塑PC。”

听起来就很燃。

英伟达正在做的是复制“Intel Inside”的底层逻辑，只不过这一次，锁定的不再只是CPU指令集，而是整条AI计算和开发栈。

而且规模更大，野心更远。它要绑定的不只是硬件，还包括整个AI时代的计算范式。

要知道，英伟达真正的护城河不是GPU硬件，而是CUDA，是已经运行了将近二十年、全球数百万开发者在上面训练模型、调试算法的软件生态。

换掉英伟达的GPU，意味着放弃所有基于CUDA优化的代码、工具链和工作流。这个迁移成本，让竞争对手的芯片性价比再高也难以撼动市场。

这是英伟达在数据中心建立的壁垒。而RTX Spark，是英伟达试图把同样的逻辑复制到PC端的第一步。

它的目标不只是卖出更多芯片，是让“本地运行AI Agent”这件事成为新一代PC的标准定义。

RTX Spark将搭载Windows系统，戴尔、华硕、惠普、联想、宏碁等主流OEM厂商均宣布跟进，秋季开始陆续出货。

微软方面则将整个Windows的Agent能力与英伟达的硬件架构深度绑定。

就在RTX Spark发布后不久，微软CEO萨提亚·纳德拉在北京时间今天凌晨举行的微软Build 2026大会上，专门邀请黄仁勋进行了一次深度连线对话。

两人从端侧谈到云侧，从RTX Spark谈到Vera Rubin超级计算机，从芯片架构谈到AI Agent的未来范式。

黄仁勋透露了一个细节：这次合作实际上起源于大约三年前，他与纳德拉的一次私下对话。那时候，两人就在讨论，能不能做一台专为AI和创作者设计的全新PC？

三年，从一次私聊到全球发布，再到主流OEM厂商集体跟进——这个周期，说明这不是一次仓促的产品决策，而是一次早有筹谋的平台卡位。

今天这场对话，也是理解英伟达与微软这场战略合谋最直接的一扇窗口。

以下，是那场对话的全文。聪明投资者（ID: Capital-nature）整理分享给大家。

纳德拉

这几天我一直在看社交媒体，也在看大家从你周末主题演讲之后都在讨论什么。突然之间，“边缘侧的不限量智能”（强大的AI不再是云端的稀缺资源，而是每台设备上随时可用的基础能力，就像今天的电量和内存一样，用户不需要为每次调用付费或等待响应）这个概念又重新变得非常热门。
你很早就在思考这个问题，也讲过很多次。现在，随着RTX Spark的推出，我觉得你们真正交付了一个突破性的系统，让AI可以变得更加无处不在。
也许你可以和我们分享一下，你对这个方向的愿景，以及你觉得它会走向哪里。

黄仁勋

这件事其实要追溯到大约3年前，当时我们两个人有过一次对话。我们在聊，能不能打造一种全新的PC，它对设计师和创作者来说会非常强大，同时也会非常适合人工智能。

它需要具备足够强的处理能力，同时还要有完整的软件栈，能够和全球的设计软件、创作者软件，以及我们正在做的所有AI工作深度集成。

3年之后，我们真的走到了这里。我们做出了一颗非常了不起的新芯片，而这个系统也得到了你们为Windows打造的这些全新软件的支持。

现在，我们已经可以在PC上运行一个本质上具备自主能力的智能代理。

如果退一步想想，这意味着什么？过去30多年，或者说40年里，我们两家公司一直在合作。从当年一起发明 DirectX，到今天打造出这样一台可以运行自主系统的强大计算机，PC已经发生了非常大的演变。

PC从一个非常强大的工具，变成了一种可以被 AI 助手自主使用的工具。

也就是说，我可能正在外出旅行，手里拿着手机，我可以给自己的PC发一条消息，让它帮我完成一些代码工作，或者实现我刚想到的一个创意。它会自动启动 PC 上的工具，按照我的要求去修改、调整或者完成设计。

而且在我不在电脑旁边的时候，它还可以和我不断迭代。

我的PC变成了一个助手。当然，当我坐在电脑前的时候，它同样也会是一个非常好的助手。

所以，PC从personal computer，也就是个人电脑，演变成personal AI，也就是个人 AI。这件事真的非常令人兴奋。

看到它真正变成现实，看到它真的开始这样工作，我非常激动。

你刚才提到的Spark，拥有非常强大的能力。它有 1 petaflop 的AI性能。

这是一种我们两家公司共同推动的数值格式。它让我们能够充分利用这128GB 内存，放下可能高达几千亿参数的模型。

而几千亿参数的模型，已经是当前最前沿的水平。

我认为，在PC上运行一个真正聪明、能够自主工作的助手，这一天已经到来了。

纳德拉

我也非常期待Windows登上GB300，那有点像把数据中心直接搬到了桌面上，非常令人兴奋。
说到这里，我们也可以聊聊数据中心这一端。
很显然，这一切最早是从我们一起建造第一台超级计算机开始的，那台机器是为了训练GPT模型。一路走到今天，我们已经走了很远。
我刚才也谈到了Fairwater的设计。它本质上是为Grace Blackwell 时代专门打造的，是为了把你们的系统设计能力和数据中心设计能力最大化结合起来。
现在，我们当然也在验证Vera Rubin，对此非常兴奋。也许你可以再谈一谈，在云端这一侧会发生什么，你们又是如何推动系统层面的创新的。

黄仁勋

我们的这段旅程确实非常了不起。我们一起打造了第一台AI超级计算机，那一代是基于Ampere的。

后来，Hopper取得了巨大的成功。

前两代主要聚焦在预训练。

到了Grace Blackwell，重点转向了后训练，也就是强化学习。这让我们拥有了推理模型。而这些基于混合专家架构的推理模型，既非常聪明，也非常节能，但它们需要巨大的系统来支撑。

所以我们打造了NVLink 72，让整整一个机架变成一台计算机。我们从一个节点，演进到一个机架。

今天，微软部署了全球数量最多的Grace Blackwell，也是最快、规模最大的Grace Blackwell部署。Fairwater是一个非常壮观的系统。它是一项工程奇迹，真的是非常了不起的成就。

它完全采用液冷，就是它是闭环系统，基本上几乎不消耗水，而且非常环保。

它的能效非常高。我们能够把token生成速度大幅提升，同时把token生成成本降低一个数量级，相比Hopper大约提升了30倍。这是一个巨大的成就。

而Vera Rubin是为另一个世界打造的。在那个世界里，AI已经是agentic的，也就是具备代理能力、能够自主行动的。

Hopper是为预训练打造的，Grace Blackwell是为训练、后训练以及推理打造的，而 Vera Rubin是为运行智能代理而设计的。

你很清楚，智能代理这种计算模式，和我们将在RTX Spark上运行的计算模式完全一样。它本质上就是同一种代理系统，只不过在云端，它的规模会大得多。

我们会同时处理数量极其庞大的智能代理，其中很多来自不同客户、不同合作伙伴。

因此，从存储，也就是长期记忆，到工作记忆，整个路径、整个代码路径都必须加密。数据在传输过程中是加密的，数据在使用过程中也是加密的。

所以我们会在机密计算领域进行真正的创新。

这整个解耦的、分布式的计算系统，你刚才也提到了CPU。Vera是一款为智能代理而设计的革命性CPU。

过去的CPU是为人设计的。我们人类比智能代理更有耐心。智能代理需要的是低延迟，这也是你们一直在推动的方向。Vera就是为极低延迟而设计的。

我们两边的团队一直合作得非常紧密。几乎在芯片tape-out很久以前，在系统真正启动很久以前，我们两个团队就已经完全对齐了。

数据中心是为Vera Rubin而设计的；Vera Rubin 也是为你们的完整技术栈而设计，并且已经集成进你们的网络、安全体系以及整个架构之中。

因此，当我们的系统从产线下来的时候，它们就已经在微软那边被架设起来了。我对这次合作真的非常兴奋。

纳德拉

是的，看到两个团队以这种接近光速的执行力推进，真的非常棒。
当然，我们做这一切最终都是为了赋能我们周围的整个生态。
你和我都经历过PC 时代、服务器时代，现在又走到了AI时代。我们一直相信，最终最重要的事情，是为每一位开发者、每一个组织创造机会，让他们能够在我们所做的工作和我们搭建的平台之上继续创造。
说到这里，英伟达也有很多软件正在进入我们的生态。比如，你们的模型会进入Foundry，你们的工具也会进入Foundry。事实上，你们的软件还会帮助我们加速很多工作负载，甚至包括数据仓库这类工作负载。
当然，Windows里面也会有很多相关能力。也许你可以谈一谈这个更广阔的愿景。因为大家经常谈某一个模型，或者某一项技术，但真正重要的是，这是一个更广、更大的机会，让人们可以在上面创造价值。

黄仁勋

我们其实已经为这一刻准备很久了。

过去几个月发生的事情，我们两家公司其实已经一起准备了15年。过去几个月，突然之间，因为代理系统的出现，因为这些非常优秀的模型开始汇聚，AI 终于变得真正有用了。

你只要看GitHub就能看到，提交到GitHub的代码数量已经呈现出完全抛物线式的增长。过去几个月里，提交数量增加了3倍。

这清楚地说明，代理系统是有用的，它们正在做真正有生产力的工作。而且，token 现在也开始变得有利可图。

所以，一方面是AI使用量的增长，另一方面是智能代理所需要的计算量，两者叠加在一起，计算需求真的已经冲上去了。

我们两家公司一直在做的一件事，就是确保这些智能代理将要使用的所有工具，都能够被充分加速。

比如Fabric现在已经实现了全面加速。我们正在加速数据处理，包括SQL、Spark、基于语义的处理、基于向量的处理、基于图的处理。

我们要确保Azure上所有可用的工具，都能够被GPU全面加速。因为智能代理是没有耐心的。

我们越快把答案返回给智能代理，它们就能越快迭代，也就能越快生成token。而这最终也是开发者、我们双方客户真正想要的：生成大量真正有价值、真正聪明，而且能够带来利润的token。

免责声明：本文观点仅代表作者个人观点，不构成本平台的投资建议，本平台不对文章信息准确性、完整性和及时性做出任何保证，亦不对因使用或信赖文章信息引发的任何损失承担责任。

“英伟达Inside”，黄仁勋与纳德拉最新对话

精彩评论