被误解的 Transformer 遗产与产品化逻辑
在科技史的叙述中, 谷歌 常被描述为“发明了火种却让别人点亮了火炬”的角色。针对 Transformer 架构的起源与 ChatGPT 的崛起,皮查伊有着不同的观察视角。他指出,Transformer 的诞生并非纯粹的实验室产物,而是受翻译功能和大规模语音识别等实际需求驱动的。
“Transformers 很快就被投入使用。Bert 和 MUM 对搜索质量的提升是巨大的,那是搜索业务领先于所有竞争对手的时期,” 皮查伊解释道。他承认在对话式产品的发布门槛上,谷歌有着更高的“质量偏见”,尤其是在处理模型毒性和搜索准确性方面。他坦言,早期的 Lambda 模型在内部甚至被认为具备感知能力,但由于缺乏成熟的 RLHF(基于人类反馈的强化学习)处理,谷歌并未急于推向市场。皮查伊认为,OpenAI 的成功部分源于在编码侧(Coding)看到的连续性跨越,这可能比单纯的语言侧信号更具突破性。
垂直整合:全栈投资构建的防御性壁垒
当外界在去年一度对谷歌的搜索业务感到悲观时,皮查伊正专注于内部的“垂直整合”。他认为,谷歌之所以能应对当前的算力竞赛,归功于自 2016 年就开始的 AI 优先战略。
“垂直整合并不是偶然,我们当时正在构建 AI 数据中心,那是 2016 年。这种整合让我们能够从研究团队、基础设施到平台进行全方位的协同。” 这种“全栈”优势在 Gemini 系列中得到了体现。皮查伊特别提到了延迟(Latency)作为产品核心竞争力的重要性。在谷歌,团队甚至拥有毫秒级的“延迟预算”。“Flash 模型的能力达到了 Pro 模型的 90% 左右,但速度快得多,服务效率也更高,这正是垂直整合助益的结果。”
搜索的未来:从检索框到“个人代理管理器”
关于搜索是否会消失的讨论从未停止,皮查伊给出的答案是“演进”而非“取代”。他设想中的搜索将不再是简单的提示词返回链接,而是向具备主动执行能力的代理式流程转变。
“搜索会成为一个代理管理器,你将能够完成各项任务,会有许多线程在同时运行。” 皮查伊认为,即便硬件外形发生剧变,搜索的核心功能——作为人类与世界的交互界面——只会变得更加扩张。他拒绝将这一过程看作零和博弈,“一旦你处于这些领域的最前沿,你会发现搜索和 Gemini 在某些方面产生重叠,在某些方面产生分歧,同时拥有两者并拥抱这种变化是件好事。”
2026 瓶颈期:当 AI 撞上物理世界的南墙
尽管谷歌拥有巨额的资本支出计划,但皮查伊清醒地认识到,金钱并不能解决所有问题。他预测 2026 年后,AI 的扩张速度将受到物理世界的制约。
“我们正受到供应能力的制约。即使你想花掉 4000 亿美元,也可能花不掉,因为内存不够,电力不够。” 皮查伊强调,晶圆产能和能源审批速度是深层次的限制。尤其是内存(Memory),被他视为目前最关键的要素之一。“领先的内存公司不可能大幅提升他们的产能,这些限制在短期内确实存在。” 然而,他也乐观地认为,这种制约将激发创新,推动计算效率实现 30 倍甚至更高的提升。
资本配置哲学:为何在悲观中坚守 Waymo
在谷歌众多的“Other Bets”中,Waymo 的坚持最具代表性。皮查伊揭示了谷歌资本配置的底层逻辑:并非基于短期情绪,而是基于对技术曲线的定量评估。
“你越有能力在更深的技术层面评估事物,就越能做出更好的决策。我们追踪 Waymo Driver 的安全性和可靠性曲线,即使在外界最悲观的时候,我们也增加了投资。” 他将这种逻辑同样应用于量子计算和机器人领域。皮查伊透露,谷歌正在构思“太空数据中心”等前沿项目。对于机器人,他认为 AI 是过去十年缺失的关键要素,而现在,“具备空间推理能力的 Gemini 机器人模型已经展现出最先进的水平。”
2027 转折点:智能过剩与工作流的深度重构
皮查伊预见到,尽管模型能力在飞速提升,但社会和企业内部的“变革管理”将是巨大的挑战。他将这种现状描述为某种程度的“智能过剩”。
“我非常确信,2027 年将成为某些事物的关键转折点。它将成为从业者完成产出的工作流方式。” 谷歌内部正在通过名为“Jetski”的智能体环境,重新定义 SRE(站点可靠性工程)和搜索团队的工作模式。皮查伊承认,身份访问控制、安全性以及再培训成本是普及的障碍,但这种转型是必然的。“年轻公司将具备 AI-native 团队的优势,而我们则必须推动这种全员的转型。”
Transformer 的发明与产品化反思
John:Sundar Pichai 担任 Google 首席执行官已满十年。如今,Alphabet 不仅是全球最大的科技公司之一,也是人工智能竞赛的领跑者,计划在 2026 年投入 1750 亿美元用于资本支出。
干杯。感谢你的到来。在讨论 Google 与人工智能时,人们经常提到的一段历史是:Transformer 架构虽然是在 Google 发明的,但随后却在 Google 之外被产品化,主要是以 ChatGPT 和类似风格的产品呈现。你现在对此有何反思?我认为这确实值得探讨。
Sundar Pichai:好的,感谢邀请我参加。这在一定程度上存在误解。Transformer 的研发是在大量使用 TPU 等环境背景下进行的。我们所做的一切在某种程度上都是为了解决特定的产品需求,就像团队当时在思考如何改进翻译功能一样。以 TPUs 为例,嘿,语音识别虽然有效,但你突然需要为 20 亿人提供服务时该怎么办。我们没有足够的芯片供自己使用。就像是,你如何解决它的推理问题?我之前并不知道这一点。
Transformers 当初是专门……这是来自我们的研究团队,但他们是受解决实际问题的驱动。而且 Transformers 很快就被投入使用。所以 Bert 和 MUM,人们低估了其影响程度,因为我们如此严谨地衡量搜索质量,那一时期搜索质量的一些最大飞跃——即搜索业务领先于所有竞争对手的时候——正是因为 Bert 和 MUM。我们构建了 Transformers 并立即将其用于搜索,以提升语言理解能力、理解网页内容、理解用户的查询,并不断构建更好的模型。
我们当时也已经开始将其产品化,内部有团队在开发名为 LaMDA 的项目。显然我们并不是首个推出此类产品的,但我认为这不仅仅是因为它仅处于研究阶段而未投入产品方向。
John:我认为情况就是这样:你进行了这项研究,随后从预期的应用方式中看到了巨大的投资回报率,至于你没有发明所有基于此技术产生的产品,这在预料之中。我想更进一步地说。
从 LaMDA 到 ChatGPT:发布门槛与时机
Sundar Pichai:我们确实构思过类似 ChatGPT 的产品,那就是 LaMDA。你应该还记得,内部曾有一位工程师认为它具备感知能力,所以,可以把它看作是他在内部交流的 ChatGPT 的早期版本。因此,我们甚至拥有它的产品版本。在平行宇宙中,Google 大概会在九个月后将其发布。
或许事实上,在 2022 年的 Google I/O 上,我们发布了一个名为 AI Test Kitchen 的产品,那里面运行的就是 LaMDA,但我们对其做了限制。
因为在内部,我们还没有一个经过 RLHF 处理的端到端版本,所以我当时看到的那个版本,毒性要大得多。我们当时根本不可能把它发布出来。而且,我认为作为一家对搜索质量有偏见的公司,我们对什么样的产品质量才是可接受的发布标准,可能设定了更高的门槛。但这并不是说我们不知道该如何把它发布出去。
我还要指出,即使在 OpenAI 发布产品时,他们大概在几个月前就已经和 Microsoft 达成了协议。所以,回过头来看,情况并不完全显而易见。我认为他们也很幸运,能在 GitHub 的编码侧看到这一点。我想也许我们漏掉了一个信号。在编码侧看到的连续性跨越可能比单纯在语言侧看到的要大。
是的。所以如果你也用它来进行编码, GPT-2 到 GPT-3 以及后来的 GPT-4 之间的跨越可能更加显著。所以,你可以指出这一点。对事物而言,所以,但我认为要回答最初的问题,我认为这与其说是研究到产品的转化,不如说是许多其他因素共同作用的结果。
Elad Gil:我还记得曾与一些参与开发 ChatGPT 的人交流过,我想他们是在感恩节那一周发布的。那算是一个相对低调的发布。那并不是那种大张旗鼓、宣称这将成为我们未来重要组成部分的发布。我认为那更像是一个很酷的测试案例。没错。这真的很有趣。
Sundar Pichai:但是,我理解这些时刻的方式是,如果你身处消费互联网领域,你就总会遇到意外惊喜。我们当时在 Go on。当时有 Google Video Search 之类的东西,后来 YouTube 出现了,只是我们收购了 YouTube。或者试想一下,如果你在 Facebook 工作,Instagram 出现了。
没有人会坐下来讨论,你不会带着那种戏剧化的心态去看待这些时刻,因为 Facebook 刚刚收购了 Instagram。没错。没错。但我所内化理解的领域是消费级互联网。人们现在能够做到,三个人坐在一起进行原型设计,并产出数以百万计的东西。我并非试图贬低任何事物,我只是说你总会遇到这样的时刻。我不认为人们会在车库里醒来就能发布出一款比 iPhone 更好的产品。那是不可能发生的,但消费级互联网并非如此运作。所以你只需要意识到这一点并将其内化。
速度的哲学:延迟预算与 Gemini Flash
John:当我思考 2026 年的 AI 竞赛时,有一件事让我印象深刻,那就是 Google 长期以来一直将速度作为其脱颖而出的首选之地。因此,最初的 Google Search 非常快,而且众所周知,它会在搜索结果中显示搜索查询耗时,以此来展示其优势。还有,比如 Gmail 相比当时竞争对手的快速搜索,或者 Chrome 相比当时竞争对手的快速表现。
现在,我会针对不同的用途使用各种 AI 服务,但在 TPU 上运行的 Gemini 速度实在太快了。我很好奇这在多大程度上属于明确的产品策略,您是如何看待这一点的?还是说情况要复杂得多?
Sundar Pichai:我一直以来都将速度——在此我们可以将其称为延迟——视为核心要素。它也是一款伟大产品的显著特征之一。而且,它几乎总是反映出该产品背后有着扎实的技术支撑。还有另一种同样重要的速度,即交付、迭代和发布周期的速度。所以这两者都很重要。
但是,正如您所提到延迟问题。说想要低延迟很容易,但您需要不断增加各项功能。因此,能力的前沿正在不断推进。所以,在某种意义上,该如何权衡这一点呢?这就是问题变得复杂的地方。
但举个例子,比如搜索,我当时正在和团队沟通,比如他们现在为子团队设定了延迟预算,精确到毫秒级。你会获得 50% 的绩效额度。所以,如果你发布了一个功能,减少了 3 毫秒的延迟,你就能为你的延迟预算赢得 1.5 毫秒,而剩下的 1.5 毫秒则会转化为用户的体验提升。没错。根据我们对你所做工作的判断,有些人可能会获得 30 毫秒或 10 毫秒的延迟预算。你可以使用它。所以,针对这一点,我们有严格的审查机制。但这就是我们认为它重要程度的衡量标准。
Elad Gil:那么。从背景来看,我想人类能够感知到这一点。是在几百毫秒的范围内,就其实际影响而言?没错。是的。没错。
Sundar Pichai:我想我们实际上,上次查看仪表板和指标时,我们在过去五年里将搜索延迟降低了 30%。但请思考一下这期间功能的发展历程。这就是为什么在 Gemini 中,要深入思考前沿技术的迭代,确保,性能与速度的平衡,而且,flash 模型的能力达到了 pro 模型的 90% 左右,但速度快得多,服务效率也高得多,垂直整合也有所助益等等。
搜索的未来:从检索到个人代理
Elad Gil:你如何看待搜索的未来?因为现在很多人都在谈论聊天界面将成为新的交互方式。显而易见,Gemini 已经整合进去了,或者说 Google 的 Search 已经在搜索结果中集成了 Gemini 或 AI 结果,但很少有人讨论代理式流程,未来每个人都将拥有一个个人代理;它不再需要你输入查询指令,而是会主动为你执行任务。比如,它不会只是回答关于旅行的问题,而是会直接为你规划好整个行程。
你如何看待搜索的未来?它是一种分发机制吗?它是一款未来的产品吗?它是人们与世界交互的 N 种方式之一吗?
Sundar Pichai:我觉得在搜索领域,随着每一次变革,你都能利用它做更多的事情。而且,我们必须吸收这些新能力,并不断拓展产品的前沿。比如,如果是移动设备,其产品演进非常迅速;当你走出纽约地铁时,你在寻找网页,你想去某个地方,你该如何找到它?所以,人们的期望在不断改变,你也必须随之调整。如果我进行前瞻性推测,许多仅仅是为了获取信息的查询,在搜索中都将演变为代理式交互。你将能够完成各项任务,会有许多线程在同时运行。
Elad Gil:那么,10年后搜索还会存在吗?
Sundar Pichai:嗯,你可能会……或者仅仅是演进,在这种情况下是演进。它会持续演进。搜索会成为一个代理管理器,对吧,在其中你会处理很多事情。我想在某些方面,我今天就在使用 anti-gravity,你有一堆代理在处理各种事务。而且,我可以看到搜索在执行这些操作的各种版本,而你正在完成许多事情。
John:但我认为你问题的核心在于,如果你把搜索看作一个不超过一行的提示词,返回一堆不同排序的结果,而不是直接告诉你正确答案或其他什么东西。我想你的问题是,那种产品形态是否存在?
Sundar Pichai:但在如今的 AI 模式和搜索中,人们会进行深度研究查询。没错。所以这并不完全符合你所说定义的范畴,但是,人们在某种程度上已经适应了那种方式。所以我认为人们会处理长期运行的任务。当然。它可以是异步的。
Elad Gil:我们最初,或者说,生命最初是以单细胞生物的形式开始的,而现在我们拥有了如此复杂的生命形态。因此,问题几乎变成了:那种形式、版本或范式最终会消失吗?事实上,过去的搜索将转化为 Agent,而你未来的交互界面就是一个 Agent,10 年或 N 年后的搜索框将不复存在。
Sundar Pichai:设备的硬件外形将会发生改变。I.O. 将会发生剧烈的改变。所以,这很难,我认为如果只想着 10 年后的事情只会让自己陷入瘫痪,但我们很幸运正处于这样一个时刻,你可以只考虑未来一年,因为技术曲线非常陡峭。只着眼于未来一年就让人感到兴奋,不是吗?
而在过去,你可能需要坐下来设想五年之后的情景。我就在想,模型在一年内将会发生巨大的变化。所以,我认为顺应这个曲线本身就是一件令人兴奋的事。所以我认为它会不断演进。但这是一个扩张性的时刻。
我认为很多人在这些时刻低估了一点,即这在我看来远非一场零和博弈。没错。就像人们未来能够实现的能力价值也处于某种疯狂的曲线上,所以一旦你以那种方式看待它,人们就会提出所有这些问题,比如,YouTube 自 TikTok 和 Instagram 出现以来表现良好,所以我可以举出很多例子。
我认为,你越是把它视为零和博弈,情况看起来就越困难。如果你停止创新或者产品不再演进,它就不可能变成零和博弈,但是只要你处于这些领域的最前沿,而且我们正在同时进行搜索和 Gemini 的开发,那么它们在某些方面就会产生重叠。它们在某些方面也会产生深远的分歧,所以,我认为同时拥有两者并拥抱这种变化是件好事。
垂直整合与市场误解
John:当我们谈论搜索及其未来走向之类的话题时,我想起大约一年前,也就是 25 年的春夏之际,外界对 Google 的情绪非常负面。当时的普遍观点是,搜索已经完了,并且将会面临非常艰难的处境。核心商业模式正受到攻击,诸如此类。Google 的股价当时在 150 美元左右。
而现在人们已经意识到那很荒谬。Google 在整个技术栈上都有布局,无论是应用程序还是模型。或是 TPU 等等,以及 Waymo 和 YouTube,还有所有这些相关业务。你认为作为知情舆论代表的投资者,在去年这个时候误解了什么?因为显然当时存在某种巨大的误解。
Sundar Pichai:当时我显然非常专注于内部事务。
John:所以,对我来说,那一刻非常明确,嘿,Overton window 已经移动了。
Sundar Pichai:我们,我当时觉得公司就是为那一刻而建立的。这种垂直整合并不是偶然或其他什么。那是一件目标非常明确的事情。我们当时正处于 TPU 的第七个版本。是的。我记得那可能是在 2016 年的 Google IO 上,我们发布了 TPU,并且谈到了我们正在构建 AI 数据中心。那是 2016 年。当时我们正在考虑,公司正以 AI 优先的方式运营。所以我们已经深刻地内化了这种转变。
因此对我来说,虽然我们在前沿 LLM 模型方面落后了,但我们内部拥有所有的能力,我们必须执行到位以把握住那个时刻。
但令人兴奋的部分在于,当我从全栈的角度审视时,我们拥有研究团队,拥有基础设施团队,拥有所有的平台。而且我们一直有目的地在许多业务上进行投资,对我而言,我突然感觉到,哇,我们拥有这项通用的技术,它可以加速所有这些业务的发展。无论是搜索到 YouTube,还是到云服务,再到 Waymo,一切都依赖于这一领域的进展。因此,这是一种获取进步的高杠杆方式。
所以我理解这一点,并且正如讨论早些时候提到的,我完全不认为这是一个零和博弈的时刻,我当时感觉一切都将扩大 10 倍,不是吗?而且也会有其他人的容身之处,回顾一下,自 Google 出现以来,Amazon 表现得很好,Facebook 也是如此。所以我们低估了所有这些事物运作时的增长情境,所以,我们需要作为一家公司执行得更好。这就是我的意思。我当时更专注于这一点。
John:是否有什么事情向外界证明了,他们已经掌握了这一点?是 Gemini 3 改变了排队的人们吗?比如,我并没有跟进所有的时间线,但还是那句话。
Sundar Pichai:我认为人们真正见证该模型能力的或许是 Gemini 2.5。而且,我特别关注前沿领域。尤其是它们的多模态能力。我们做了很多尝试,功劳属于 Google DeepMind 团队,我想我们在初期支付了稍微多一点的固定成本,但我们从第一天起就将 Gemini 模型设计为具备高度的多模态能力。
因此,我认为在某些领域,这种优势开始显现,nano-banana 就是一个例子。所以你能够将这一切尽收眼底。但听着,这是一个令人惊叹、极其充满活力的前沿领域。我认为有两到三家实验室正在非常激烈地相互竞争。在任何一个月里,我们都会觉得,太棒了,我们做得很好。糟糕,有几件事我们落后了,但我认为几个月后情况又会发生动态变化。所以我认为前沿领域的竞争正如你预期的那样激烈。这就是我的看法。
AGI-pilled 与指数级增长的直观感受
Elad Gil:这很有趣,因为当我与非 Google 或其他实验室的研究人员交谈时,他们常提到的一点是,他们觉得那两三家其他实验室与 Google 团队的区别在于,Google 并没有所谓的 AGI-pilled。换句话说,他们对 AGI 即将来临及其带来的加速发展持较少的信仰。显然,Google 的员工们对此进行了深刻的思考。A,你认为这是真的吗?那么 B,你认为这一切是否影响了人们对未来实际样貌的构想,并因此影响了人们构建事物的方向?
Sundar Pichai:你看,我认为,我们可能已经将资本支出从 300 亿增加到了 100 亿,大约是 1800 亿。这可是真金白银,如果你不是以某种方式考量未来曲线,你不会这么做。我认为这在很大程度上属于语义问题,或许是因为我们是一家大型公司,拥有许多触及各层级众多用户的产品。或许我们讨论它的语言会有所不同。我认为创始人们是 AGI 的构建者。
这可能是我最真诚的一次谈话。我认为关于 Google 未能理解什么是 AGI,或者 Demis 及其团队,又或是 Jeff Dean 及其团队未能理解的说法,在某个时间点,我不知道,Demis、Jeff、Ilya、Daria 等人都在那里。所以他可以,我很喜欢这个反驳。就像是在说,嘿。
John:你过去 20 年都在关注这些事吗?
Sundar Pichai:没错,所以这对我来说讲不通。
John:我觉得其中一些原因在于,如果你是一家较年轻的公司,或者你更像是一个纯粹的研究实验室,你可能就会把总部设在 San Francisco。
Sundar Pichai:是的。有很多微小的属性可能会产生差异。但我不认为在基础层面上,对于曲线走势的预判,或者我们如何内化这项技术,存在什么分歧,你看,我觉得即便是公司内部,我们中也有一群人正处于最前沿,不断启动 agent,观察这些东西能做什么,看着 agent 习得技能、完成任务,并回顾它们三个月前能做什么。
John:他们在内部实实在在地感受着那种指数级增长,我觉得你们俩都对,我同意这一点,你可以把它看作是 Google 的历史。我觉得很多人得到的是一种感觉,我曾看到一条推文转瞬即逝,那大概就是最核心的东西。要解释当前硅谷正在发生的事情,你必须意识到,每一位科技高管现在都患有严重的 AI 精神错乱,他们投入了大量时间编写代码、与 AI 对话以及处理诸如此类的事情。我觉得这是一个很有趣的观点,而且并非毫无道理。我很好奇,在最近这段时间里,你有哪些感受到了 AGI 的时刻?或者说,你现在在多大程度上患有 AI 精神错乱?
Sundar Pichai:我第一次感受到 AGI 的时刻是 2012 年,当时 Jeff Dean 展示了 Google Brain 的最早版本。那时神经网络识别出了一只猫,所以那是 2012 年。我和 Larry 一起去了医生那里。RAPA 挑战赛。那可能是在 2014 年,我想。我需要准确说明我们去那里的时间,也就是看到汽车开过去的时候。Demis 进行演示,那些最早期的模型已经具备了我们所谓的想象力。
像这样的时刻有很多,所以显而易见,这项技术正在不断进步。就当下的生活体验以及那种直观的感受而言,我想说的是,如果你在编程时给它一个复杂的任务,而你根本不需要打开 IDE,直接处于某种智能体管理者的环境里看着它完成任务,你就会知道它有多么强大。所以,你可以把它称为现场 AI。确实会有这样的时刻。
John:是的。我最近做了一个小型的业余项目,过了一段时间,我心想,噢,我很好奇它用的是什么语言,但这只是在一个一切都运行起来之后我才需要去问它的细节问题。是的。它就像魔法一样工作。
Sundar Pichai:是的。所以你确实会有那样的时刻。没错,但真正令人惊讶的是这条曲线的斜率。没错。确实如此。而且你正在多个范式上对其进行改进。显而易见,未来还会有进一步的发展。
“吃狗粮”:CEO 如何与产品保持连接
John:对。当你谈到这种直观感受时,我觉得有一点对科技公司至关重要,而每位 CEO 对此的思考方式都不同。那就是如何与日常用户的产品体验保持紧密联系,因为科技产品非常抽象,所以很容易出现那种情况——你不能仅仅依靠团队的报告、幻灯片和电子表格来进行管理。
所以,Tony Xu 曾谈到他至今仍会亲自去当 DoorDash 配送员,以保持与那种用户体验的深度连接。我们在每周的全员大会上有一个固定环节,我们称之为“走一走(walk this door)”,我们会一起在仪表板上点击浏览,然后我们会纠结于诸如“为什么那个模态框出现在那里?”这类问题。或者是其他令人困惑的地方,总之就是让我们集体使用这款产品。我很好奇你是如何运作的,以及你在 Google 是如何确保自己始终与产品的使用体验保持紧密联系的。除了你每天使用 Gmail 和其他所有产品之外。
Sundar Pichai:噢,是的。就像所谓的“吃自己的狗粮”一样,字面意思就是使用内部版本。我会专门预留时间,进行高强度的使用。也就是说,我会留出专注的时间来做这件事。这很有帮助。比如就在两周前,我在健身房拉伸时用着 Gemini Live。我就想,我要和它聊上整整 30 分钟,只聊一个话题。你确实会做这些尝试,有时会有成效,有时也会让人感到挫败。我们从中获益良多,所以我强迫自己以那种超级用户模式来使用它,并以此保持密切联系。
X 很有帮助,因为有时你能从上面获得最直接的反馈。感谢你修复了 Google Calendar 的问题。那真是太好了。嗯,还有一些问题需要修复,但感谢你指出来。所以,X 很有帮助,因为你可以直接获取最原始的评论,我也尝试直接关注这些反馈。
但我告诉你什么是有帮助的。在内部,比如,我会像之前提到的那样,向 anti-gravity 进行查询,也就是我们内部版本的 anti-gravity,嘿,我们发布了这个东西,人们对此怎么看,告诉我人们讨论的最糟糕的五件事和最好的五件事,我输入这些指令,现在它就能给我反馈了。所以我的生活变得更轻松了吗?是的。在过去,我必须花费更多时间去试图了解这些情况。现在,一个 AI agent 正在帮助我完成这一过程。所以,我可以先了解一下,为了进入那个领域,我最初应该投入多少资金?这实际上是在利用这些工具。是的。所以即使是我也在经历这样一个过程,所以我正在努力适应这个未来。
经济增长与供应限制的瓶颈
Elad Gil:我想,正如你提到的,A,这不是零和博弈;B,人们正在看到各种生产力的提升。如果你回顾许多之前的技术周期,互联网、移动设备或 SaaS 要在实际的 GDP 数据中显现出来,确实需要一段时间。在 AI 的背景下,我们是从数据中心建设的角度来看待这一点的,那正在推动 GDP 增长的一部分。你如何看待三、四年或五年后的未来?你认为美国......经济是否因为 AI 而变得更加庞大?如果是的话,规模增长了多少?
Sundar Pichai:听着,要让这些回报变得合理,总归要在某个地方体现出来,这花了多久时间?我想可能是 Sequoia 的人写了篇文章,说人们正在投入这么多资金。
John:他们是在将资本支出与利润进行比较。
Sundar Pichai:没错,这可能是在两年半之前。当时有种说法认为这不合理,因为你需要达到那个水平的回报。你可能需要 10 倍的增长空间。没错,没错。从那时起,我需要去核实一下具体数字。首先再次确认,所以在某个节点,它必须实现调和。明确一点,我们正受到供应能力的制约。我们观察到所有应用领域都存在需求。
Elad Gil:实际上,我毫不怀疑这是一个巨大的市场和成果。所以我的问题是,我认为人们对很多事情存在误解。例如,人们经常讨论软件工程预算,以及其中 token 成本与薪资的占比。在某种程度上,我认为那个市场一直因缺乏优秀的软件工程师而受到需求制约,因此供给的突然增加可能会使该市场增长 10 倍。换句话说,我认为软件工程编码市场的规模比任何人想象的都要大得多,用 token 预算与工程师薪资对比来衡量是一个错误的指标。所以我实际上认为它应该能促进诸多方面的发展。我只是对你的观点感到好奇,比如,我们认为这实际上会带来多少增长?我其实一点也没有怀疑所谓的潜能与结果之间的关系,或者说,我明白了。
Sundar Pichai:是的。听着,回顾互联网并观察 GDP 增长,它并不能完全捕捉到我们对互联网的真实感受,所以,也许如果没有互联网,GDP 增长会是负的。消费者剩余。所以,展望未来是很困难的。
我确实认为社会在不同层面上存在着自然的抑制机制。显而易见的例子是,计算能力的构建曲线与我们改进模型的速率所遵循的曲线是不同的,所以你已经在处理一条受限程度更高的曲线了。那么,你如何将其推广扩散到社会中呢,我们正在与 Waymo 合作进行这项工作,你可以让它比人类驾驶员安全得多,但你也知道,我们必须谨慎对待推广的速度等问题。所以有时,你该如何负责任地将其推广到整个社会中呢?
在所有这些层面都存在制约因素,但我觉得,美国经济比 10 年前规模大得多了。因此,即使增长率提高 0.5 个百分点,那也是巨大的贡献。所以我预计事情会这样发展。
算力竞赛中的物理障碍
John:倾听 Sundar 的发言,有力地提醒了我们以真正的互联网规模进行运作意味着什么。然而,谈到商业时,大多数企业被迫在孤立的状态下做出关键决策。他们仅通过自己的视角来看待互联网经济,只使用存在于其内部的数据。这就是 Stripe 发挥作用的地方。因为我们每年处理 1.9 万亿美元的全球支付,所以我们拥有全景式的视野。
当你基于 Stripe 进行构建时,你接入的是那套网络智能,从验证用户身份到在欺诈发生前将其拦截,再到简化企业间的连接方式以及了解哪些支付方式在本地效果最佳,均涵盖在内。我们构建了一个系统,利用全球 1.6% 的 GDP 来保护并增加你的收入。因此,如果你想利用价值、Stripe 网络智能的力量,来看看你在这里能构建什么吧。
你提到了供应限制,我认为这是 2026 年一个非常有趣的决定性特征,基本上,你说的是 1500 亿美元的资本支出,还是 1800 亿?
Sundar Pichai:我们已经说过会在 1750 亿到 1850 亿之间。
John:好的,也就是 1800 亿美元左右的资本支出。让我觉得有趣的是,即使 Google 想花 4000 亿美元的资本支出也花不掉,因为内存不够,电力也不够,以及所有这些组件都有限制。所以,你能简单列举一下吗。你可以找到我们需要的一定数量的电工。没错。所以我很想听听你对各种瓶颈问题的概述。
Sundar Pichai:你看,从某种层面上讲,你必须追溯到实际的晶圆产能之类的问题,所以,还有更深层次的基础性因素,我认为晶圆启动量是一种根本性的制约因素。我认为电力和能源问题更容易解决。许可审批以及在监管环境下开展工作可能是一种制约,也就是你推进工作的速度。
John:尽管在支持增长的地区,比如 Texas、Nevada 或 Montana 有很多土地,但也许还是不够?
Sundar Pichai:我认为我们正在取得巨大的进展。我认为对于美国而言,这是一件特别重要的事情。你会对那种节奏感到敬畏。在中国,他们建设的速度有多快。所以我真的认为我们需要学会更快地进行建设。比如,你几乎必须转变思维模式,去思考在物理世界中实现 10 倍速的建设需要做些什么。
但我会担心这会成为一种制约因素。我认为,可能会出现越来越多的阻力,所以,这并不像少数人决定要加速建设那么简单。比如针对数据中心的暂停令之类的事情。所以我我会说,如果它确实开始了,审批和执行工作的能力将至关重要。而且我认为政府确实在进行许多有益的工作。我认为人们已经意识到需要把这些事情做得更好。接下来是供应链中的关键能力。内存就是一个很好的例子。我们在短期内受到这些因素的制约。每个人都会对此做出反应。
但我认为我们所有经营公司的人,无论你对 AGI 的信念有多坚定,都会面临这种误差范围,比如,你究竟能有多乐观?你所能承受的利润率是多少?因为世界上存在可能出错的无关因素,这些因素超出了控制范围。所以每个人都在做出相应的调整。这些都是限制因素,以及限制因素。所以我认为,那就是我所看到的限制所在。
John:你认为内存是其中最大的组成部分吗?
Sundar Pichai:内存绝对是目前最关键的要素之一。
John:你刚才提到在短期内,你认为仅靠人们增加供应和高昂的价格就能解决问题吗?
Sundar Pichai:领先的内存公司不可能大幅提升他们的产能。因此,这些限制在短期内确实存在,但随着时间推移会逐渐缓解。但我确实预期所有这些因素都会构成制约。顺便说一下,我认为这会推动大量的创新,我们将实现。将这些事物的效率提升 30 倍。就像这样,所有这一切都在同时发生。
模型自我提升与算力壁垒
Elad Gil:这是否会导致寡头垄断市场?如果你观察模型侧的情况,你会发现许多关于模型及其改进方式的观点都指向了自我提升。模型将开始编写越来越多的自身代码,自行完成更多数据标注工作,等等。
John:所以你是指,目前掌握算力的人是在玩“抢椅子”游戏吗?
Elad Gil:没错。就是谁拥有算力,以及相对于整个行业的能力,你能实现多大规模的扩展?如果每个人的算力都大致相当,你实际上就限制了某人相对于其他人能领先多少的上限。你认为这种说法是正确的还是错误的?
Sundar Pichai:我认为这是一个思考此问题的合理框架。
但有些事情是,我来到这里时我们刚好发布了 Gemma 4。
Elad Gil:而且它确实是一个非常优秀的开源模型。我是说,中国的模型非常出色。但我认为在中国之外,它确实是一个非常优秀的开源模型。Gemma 4 的前沿性在时间维度上既巨大又没那么巨大。比如 Gemma 4 是基于 Gemini 3 架构的。
John:没错。这事儿真的很诡异,你在谈论的是一套可以装进 U 盘的权重文件。
Sundar Pichai:是啊,是啊,这太不可思议了。所以这真的很疯狂,它不像 SpaceX 的火箭那样庞大。
Elad Gil:我总是很震惊,你运行了几个月甚至更久的数据中心,最终产出的竟然只是一个扁平文件。从字面上看,这就像是拥有一个 Word 文档之类的东西,而那就是你的模型。这太神奇了。
Sundar Pichai:因此,它具有这些独特的属性,这让我不禁对那些框架提出质疑,并思考:我们该如何看待这个问题?但我认为,至少在推理层面,你的观点是一个非常合理的切入点。试着思考一下。但我确实认为,每个人都在努力寻找如何打破资本激励的限制,以寻求突破。这股动力是非常巨大的。
John:但正如你所说,世界上的内存资源终究有限。所以,任何资本激励都无法真正解决 26 或 27 内存供应的问题。
Elad Gil:那可能就是你会看到更多分歧出现的时代。
Sundar Pichai:没错,所以你要记住,这必须与增加产能的途径相平衡,也就是要能够批准建设那些数据中心。
所以这种限制可能并没有看起来那么严重,因此,你必须设想所有必要条件的总体需求集合,并将其彻底考虑清楚,
John:包括资本。没错。但再次强调,让我感兴趣的是,人们可能会在当前的 CAP-X 基础上进行更多投资,但我们现在只是受限于 26 年和 27 年的现实世界制约因素。这有点类似。霍尔木兹海峡(Strait of Hormuz),无论你给石油定什么价格。最终,如果你从系统中撤出每天 2000 万桶石油,你就必须消减掉每天 2000 万桶的需求。这和内存的情况很相似,如果需求超过供给,最终必然有人无法获得他们想要的内存。
Sundar Pichai:但还存在其他制约因素,对吧,比如将安全性作为一种制约条件。
John:而且这些模型绝对会摧毁目前市面上几乎所有的软件。
Sundar Pichai:或许已经在发生了,只是我们不知道。我们坐在这里交谈。
John:你真的认为所有软件都会被摧毁吗?因为像 SSH 这种东西,人们已经尝试破解很久了。你考虑的只是这些吗?
Sundar Pichai:不,我指的不只是采用开源软件或大型平台,有多少零日漏洞?是的。所以系统里确实存在这些制约因素,你不能仅仅通过愿望就让它消失。
Elad Gil:有人告诉由于 AI 的发展导致供应增加,零日漏洞(zero days)的黑市价格正在下跌,我认为这是一个非常有意思的市场指标,确实。
Sundar Pichai:一点也不惊讶,确实一点也不令人惊讶。
John:所以,但是。
Sundar Pichai:那么,它实际上是如何在社会中扩散的呢?其影响又是什么?所以,我认为其中存在一些相似之处。所以我认为可能存在一些隐藏的制约因素。是的。如果可以的话,系统可能会受到冲击。尽管如此,我真心认为未来有很大的上升空间。有些制约因素或许是有帮助的。是的。我认为制约能激发创造力。这是一个压缩周期。效率更高。它或许能促成一些重要的对话,否则这些对话可能根本不会发生。我想,仅就我提到的安全性这一点而言,我在思考,我们需要更多的协作。是的。而这在今天并没有发生。会有一个时刻,这可能是一个转折点,所有这些事情,我不认为你可以奢望它们消失。是的。
谷歌的隐藏“宝库”:量子计算与机器人
Elad Gil:没错。实际上,与此相关的是,Google 确实拥有一个令人惊叹的投资组合。我们所拥有的东西既有自研的,也有收购进来的。从所有权的角度来看,你拥有相当大比例的 SpaceX,我想,我不确定具体金额,但我记得很久以前大约是 10%,还有 Anthropic,大约百分之十。还有 Waymo 的多数股权,这简直是一件了不起的事情。
然后在内部,显然还有大量已经开发出来的惊人技术。我们谈到了 AI 和 Transformers。还有 TPUs。显然,Waymo 是这些项目中的另一个。还有量子技术。你们刚刚发布了一个非常有趣的研究成果。还有其他值得人们关注、特别有趣,或者未来可能会产生重大影响的隐藏成果吗?也许是人们低估了的那些。
Sundar Pichai:你看,我们一直在努力推进这些长期项目,当你最初宣布它们时,看起来多少有点荒谬。比如,我们正处于构思太空数据中心的早期阶段,但你之前关于“约束激发创造力”的讨论很有启发性。
John:如果把眼光放长到 20 年后,你会把这些数据中心主要放在哪里?
Sundar Pichai:你打算把这些数据中心大部分放在哪里。确实是很难解决的问题。但这些只是我们今天思考的项目案例,它们远超 2010 年的水平。量子计算本身就是这些项目之一。我们正以深度的投入在该领域取得进展。对此我感到非常兴奋。
Elad Gil:你认为量子计算会在哪里产生最大的影响?因为人们主要谈论的是分子模型。他们谈论的是密码学。人们一直在开发某种量子抗性密码学。在分子建模方面,深度学习模型在某些情况下似乎表现得非常出色。你们通过 AlphaFold 开创了这一先河。你认为量子技术真的重要吗?如果是的话,你认为它会在哪里产生最大的影响?
Sundar Pichai:从抽象层面来看,我觉得它越来越多地用于模拟自然。正如你所知,鉴于自然界本质上是量子的,你需要量子系统才能更好地对其进行模拟。我们或许能以一种令人惊讶的方式通过经典计算技术实现这一点,或者通过足够的压缩以及,抽象化来达成目标。
John:但我从根本上认为量子技术在那方面会有优势,而且我不知道,我们目前仍不理解受精过程的运作机制。
Sundar Pichai:就像有很多复杂的情况,这或许是你的背景,回溯到你大学时所做的事情,会更多一些。所以我的直觉告诉模拟天气、模拟现实等等,我认为 Quantum 会有优势。我认为技术发展的规律是:先将其发展到可行的规模,然后加以利用,接着人们的创造力会在此基础上发掘出各种应用场景。所以我总是举这个例子:移动电话加上 GPS 成就了 Uber。在从事手机研发的人中,没人能预见到这会是平台转型后的成果。所以,如果你真的能让量子技术发挥作用,我相信它会有非常、非常、非常、非常多的应用场景。没错。这就是我的看法。
John:抱歉,我们打断你了。你刚才在谈论你在 Google 比较偏好的、更前沿的一些领域。
Sundar Pichai:我认为我们正在取得进展,Google DeepMind 团队正在深入思考机器人技术,而且,机器人技术是我们公司曾经涉足过早的一个领域。事实证明,对于 15 年前或 10 年前出现的许多想法来说,AI 曾是缺失的关键要素。但是,Gemini 机器人模型在空间推理等方面都有所涉及。所以我们绝对拥有最先进的水平。相关的模型都在那里。
我们正在以一种讽刺的方式与 Boston Dynamics 和 agile 以及其他几家公司重新建立合作,并以坚定的态度取得进展。市场上也涌现出了许多非凡的初创公司。我们正在进行投资,比如我之前提到的量子计算、太空数据中心,以及与 Wing 合作的无人机配送。我认为我们正在扩大 Wing 的规模,在一段合理的时间内,大约 4000 万美国人将能够享受到 Wing 的配送服务,我指的并不是好几年以后,或者类似遥远的未来。但重申一下,当你开展这些长期项目时,这一切都是有条不紊、日积月累的过程。所以,我们是全心投入的。
Elad Gil:Isomorphic,非常令人兴奋。我是这么觉得的。
Sundar Pichai:考虑一下,专注于以有针对性的方式改进这些模型。药物发现过程中所有可能的步骤。尽管你仍需进行诸如三期临床试验等漫长的程序,但以这种方式推进能够获得更高的成功概率。
Elad Gil:没错,我认为这是我见过的最明智的方法,因为它考虑了不同的生物模型,并且真正思考了超越单纯分子设计的更广阔领域,而我认为这正是大多数同类项目所停滞的地方。
资本配置:为什么保留 Waymo?
John:确实,这看起来非常精明。我可以问一下吗?我很好奇 Google 内部的资本配置究竟是如何运作的。优秀的资本配置在于内部化资本的机会成本,并将业务产生的现金投入到回报率最高的用途上。在商学院教材的简单案例中,假设你是 Boeing,你拥有业务产生的现金,你可以选择竞标下一个国防合同并投入相应的研发资金,同时预测合同带来的营收;或者你可以选择研发一款全新的商用客机,投入相应的资金并建模预测其收益。这就像是在比较 16% 的内部收益率和 19% 的内部收益率,显而易见,我会倾向于选择 19% 的那个。
而在 Google 的案例中,各项项目极其多样化,例如,我们可以为 YouTube 团队提供更多资金,让他们去改进推荐算法,从而实现 10 个月的增长,并以此提升变现能力。或者我们可以为 Waymo 团队提供更多资金,让他们能够真正更快地进入市场或更快地扩大规模。或者我们可以投资于这种可能在五年内见效的新型 AI 方法。
所以我很好奇,如果你试图将资本投向最高效和最优化的用途,并且在进行最终比较时,你该如何权衡那些在本质上差异巨大且收益曲线形态迥异的项目?这简直是太 John 的问题了。我必须知道答案。
Sundar Pichai:你还得加上 R.R.C.,那样才算是个好问题。听着,我今天比以往任何时候都深有感触。具有讽刺意味的是,这正是因为 T.P.U 的分配问题。所以在某种程度上,我觉得甚至需要更多的 HDPU,所以,具有讽刺意味的是,计算机让这个问题变得更加紧迫了。顺便说一句,在我所做的所有事情中,我非常期待 AI 作为伙伴,至少能为这项任务提供输入。我认为一旦我们真正能够实现所有数据的连接和流通,模型就已经具备了相应的能力。这更多的是关于如何解锁所有数据。我认为我们会成功的。能够有所助益。所以我对此深有感触。
从历史上看,我认为在 Google,我们拥有的优势之一是,有时我们在周期的早期就做出了这些决策。所以这几乎就像是回归到那条路线。这是一种深度的技术导向。而且,我们实际上思考了很多关于你不久前问的问题,比如,那些长期目标是什么?所以我认为在那个阶段进行思考会更容易,因为你最初的资金投入规模可以小一些。但随后,正如你所知,你需要保持长期投入,同时确保自己在深入层面取得进展。
因此,只要你能看到潜在的技术(以量子技术为例),我们该如何评判它呢?我们评判的是其底层逻辑,比如你会设定关于逻辑量子比特、纠错、大规模稳定逻辑量子比特阈值的目标,设定在何时实现,并考察团队是否有能力做到这一点。所以我认为你是以这种方式进行评估的。所以,我不想说是优势,但我认为这是我们思考问题的方式之一。我们一直保持严谨,或者至少对我而言很重要的一点是,以一种深度方式进行早期技术押注。这确实有所帮助。
但从长远来看,看吧,我一直认为你必须评估这些事物的长期价值,所以,在某种直观的层面上,你几乎是在思考五年到十年后的期权价值和时间价值。而你预设了一种疯狂的增长,并仔细思考这些决策是否合理。所以 TPU 的投资在这方面一直很棒,而且,我们一直在稳步投资。Waymo 就是一个很好的例子,我认为我们在两三年前,当世界其他地方对它感到悲观时,我们反而增加了投资。当时其他人,甚至是一些业内人士都在退缩。
Elad Gil:那真的很神奇。那是一种非常神奇的体验。我现在每天都坐 Waymo 去上班。
John:当你能够做到的时候,这就是一个很好的例子,就像我提出的这个问题:Google 确实会砍掉一些项目,而且你尝试过各种事情,最后你说,我们实际上不会完全资助 X 的这部分业务,或者,我们不会再继续了,我们要让这个产品退役。这行不通。但 Waymo 尽管从极具说服力的演示到实现商业化服务经历了漫长的道路,你们却始终没有失去信心。那么你们当时看到了什么?是一个定性的判断?还是一个定量的决定?你们是如何决定砍掉 Loon 但保留 Waymo 的?
Sundar Pichai:我认为这与某种量化指标有关,你们观察 Waymo Driver,也就是底层技术,即软件是如何驱动汽车的?
以及在安全性和可靠性方面的进展,这是一项长期任务,它有多安全,你们将如何实现它?你们会追踪那条曲线。你们会预测或设定目标,明确想要达到的位置以及根据预期表现如何进行评估。那些曲线。我认为团队表现得非常出色。也许曾有过停滞不前的阶段,但正是在那些时候,你需要对团队突破瓶颈的能力抱有信心。
John:但我认为,你越有能力在更深的技术层面评估事物,你就越能做出更好的决策。
Sundar Pichai:或者至少,我一直是这样尝试的。
Elad Gil:我听到过一个关于 Waymo 的观点或讨论,即最近观察到的巨大进步,很大程度上是因为过去依赖于手工绘制的启发式规则,比如如何处理驾驶中的极端情况,或者发生突发状况时该怎么办?你该如何应对?其中一部分几乎是人工绘制出来供车辆遵循的。因此,它能处理的事情范围非常有限。而真正的突破在于几年前随着 Transformer 浪潮的兴起,转向了端到端深度学习。你认为如果 Waymo 在五年前起步,它今天所处的位置会和从 15 年多前开始时一样吗?考虑到那是推动其前进的突破性进展。
Sundar Pichai:你看,我认为,我们之前讨论过机器人技术。你可以把 Waymo 看作一个机器人。我认为那些在过去三年里开始从事机器人技术的人,从定义上讲,进步速度也许会更快。但我认为 Waymo 是一个高度集成的系统。它包含多个维度。这并不完全就像你处理像 TSM 或 SpaceX 发射任务那样复杂的事情,你所讨论的是这些事物中极其复杂的系统集成。我认为 Waymo 隐藏了其中一些方面,即你如何执行它的时机以及工艺本身至关重要。话虽如此,我确实认为端到端方法将会在这些系列中成为一个意外。
Elad Gil:因为仅仅拥有一支团队可以说对 Alphabet 和 Google 而言就是一个巨大的优势,仅仅是你持续对其进行投资,随后在某个隐秘的时间节点上,这项技术的腾飞带来了超值的回报,这非常明智且具有前瞻性。我只是觉得探讨一下这如何应用于其他领域会很有趣。因为正如你提到的机器人领域,机器人技术的发展历史似乎可能会有所不同,因为现在你可以快速推进。你们是否考虑过重新内部化硬件,还是说将主要通过合作伙伴驱动的模式将这些产品推向世界?
Sundar Pichai:我认为我们会保持非常开放的态度。这是我从 Waymo 以及在 AI 领域利用 TPU 等经验中获得的教训。我认为要真正地推动技术前沿,特别是在涉及安全、监管等各个方面时,你需要一手的产品反馈周期经验。因此我认为,拥有第一方硬件最终将变得非常重要。这就是我在现阶段的看法。
杠杆、净现金与资源受限下的管理
John:听起来不错。所以我还有两个关于资本配置的问题。您能否论证一下 Google 在历史上是否杠杆率偏低,因为 Google 过去一直保持着雄厚的净现金状况。考虑到 Google 拥有的想法多到难以应付,它不仅点子层出不穷,而且核心业务也保持着极其持久的增长。我认为 Google 显然对这些核心业务有着非常深刻的理解,而且正如您所知,其增长率一直高于 Google 的资本成本。
回顾过去,Google 是否应该更积极主动地采取杠杆化的财务立场。即比现有的强劲净现金状况稍微激进一点,并将这些资金投入到新项目中,或者为 Google 的股东回购更多核心业务股份,亦或是进行更多的少数股权投资,毕竟 Google 在这方面的表现一直处于行业领先水平。
Sundar Pichai:这是一个很好的问题。例如,如果 Waymo 能更早达到目前的阶段,我想我会更早地投入资本。
John:所以在某种程度上,我认为您的判断标准在于,您希望成为资本的忠实管家。
Sundar Pichai:因此,如果你看好投入资本回报率(ROIC),那么你会希望将每一分钱都投入到那里。
John:但如果说,你持有的过剩资金在其他方面没有更好的去处。
Sundar Pichai:这就是我们也投资其他公司的原因,对吧,即使当时并非如此。但我们始终是以负责任的管理者这一视角来思考问题的。是的。我们认为对 Stripe 的投资体现了我们作为资本管理者尽职尽责的一面。SpaceX 也是如此。对吧。还有 SpaceX 和 Anthropic 等等。所以我认为,随着 AI 浪潮的到来,我们有了更多可以妥善配置资本的机会,因此我们正在这样做。是的。但我认为我们一直以来都秉持着这种思维方式。
但我本乐意更早向 Waymo 投入更多资本,但当时我们尚未达到实现这一目标所需的成熟度。
从安全角度来看,在 Waymo 发展的某个阶段,我们确实采取了安全第一的策略。
John:而当时那样做并非正确的做法。你是否认为,如果某些项目能更早获得更多资本,它们本可以发展得更快?它们只是需要一个自然发展的过程。
Sundar Pichai:我不会这么说。但我认为总的来说,即便我们可能在决策上出了错,但我们至少秉持着这样的原则:如果我们对某件事感到兴奋并确信其价值,我们愿意投入资本将其贯彻到底。
John: 那么关于资本分配的另一个问题是,从历史上看,科技公司绝大部分的研发支出都用于人力成本。而且,人员编制是通过非常严格受控的流程来管理的。确实,当你考虑如何分配研发工作时,本质上是在分配高薪人才去攻克相应的挑战。除非你在进行某些计算成本极高的事情,比如 Google 显而易见会投入的 Google Books 项目之类,否则技术成本其实并不高。但从广义上讲,与人力成本相比,技术成本只是次要考虑因素。
正如你所说,我们现在正进入一个情况有所不同的世界,这涉及 TPU 以及如何分配这些资源。仅从非常具体的预算层面来看,这在 Google 内部是如何运作的?比如,公司是否有整体的 TPU 预算,当你为项目分配资源时,以前是给一定的编制预算,现在是既给编制预算,又要同时给编制和 TPU 预算吗?它们属于同一项预算吗?在进行季度评估或年度评估时,这具体是如何运作的?
桑达尔·皮查伊: 我们一直都有计算预算。替朋友问的。替朋友问的。
我们一直都有计算预算,即使是在传统计算领域,就机器学习而言,我们广泛使用了 TPU 和 GPU。关于机器学习计算的规划,我们对人力规划也非常审慎,但这一直是我们必须考量的内容。是的。在机器学习计算方面,我们经历过资源充裕的阶段,也经历过作为一家公司受到限制的阶段。但现在确实处于非常紧缺的状态,所以你得投入更多时间。
至少我每周会专门花一小时,在非常细致的层面思考这个问题。因此,我会按项目和团队了解他们所使用的计算单元,而且,至少我掌握了这些信息,我正在审视并评估它。从某些方面来看,我认为这是目前一件非常重要的事情。
John: 在很多情况下,计算是稀缺资源,因此你要确保 Google 宝贵的计算资源被投入到最有价值的计划中。
Elad: 没错。在 GCP 的背景下,你是如何看待这一点的?以及 Google Cloud,因为在那里你实际上是将计算资源分配给他人,而不是用于自身目的,且考虑到系统内的各种限制。你是如何思考这种差异化分配的?
桑达尔·皮查伊: 听着,Elad,要提前规划,所以当我们进行前瞻性规划时,云团队正在进行前瞻性规划,他们制定了计划,并且,你在为此提供资金,你这样做是为了满足我们的内部需求。你要进行前瞻性规划。作为其中的一部分,你还要与客户签署长期承诺。我们向客户做出的任何承诺都是神圣不可侵犯的,所以这些都是合同义务。所以,通过规划来解决大部分问题。确实如此,当你进行规划时,我们都处在一个资源受限的世界中。所以我认为 Cloud 团队会说他们不知道自己所需的算力,诸如此类。但你会通过提前规划来解决这个问题。
产品改进建议:从 GCP 到 Google Docs
John: 说到 Google Cloud,我有一个一直留到这一部分才提的产品请求,我知道你很期待。你打算把它发布在那上面。没错,是这样。
不过说真的,我要说一件事,GCP MCP 的效果非常好,它可以让你的 AI 以编程方式直接与 Google Cloud 进行交互。我想你们几乎开放了所有功能,除了核心的权限管理之类的内容。我觉得在某种程度上,Google Cloud 的痛点之一在于其功能过于繁杂,我确信你们偶尔会听到人们抱怨它有点难以导航,比如你必须先创建一个组织、一个项目等等,然后再找到合适的服务,诸如此类。而现在,这一切都不重要了。你只需要说,嘿,去添加这个 Google Cloud 功能即可。因此,这确实让 Google Cloud 受益匪浅,因为它涵盖的范围非常广泛,功能极其丰富。
我们在 Stripe 也遇到过类似的问题,随着我们不断增加功能,能够读取所有 API 文档并指导用户驾驭这一庞大产品界面的 AI 显得尤为重要。所以,这方面的应用效果非常好。
桑达尔·皮查伊: AI 作为各种事物编排层的愿景,结合我之前的问题,即使是在企业内部,作为首席执行官,你并非缺乏数据,但如何将这些数据整合到一起呢?在过去,这意味着又一个大型的类似 ERP 的项目,需要去连接所有数据源等等。再说一次,AI 以一种对最终用户有意义的方式成为这种编排层,我认为看到这一点非常令人欣喜。
John: 而且产品界面覆盖的范围越广,这种收益就越显著。同样,我们在 Stripe 也一定程度上看到了这一点,但我感觉对于 GCP 而言,这必然会产生巨大的效应。
桑达尔·皮查伊: 我认为我们还可以做得更好。所以,你说得对,我认为这是一个巨大的机遇。
John: 是的。我对此真的非常满意。好的,接下来谈谈我的产品。
你带来了什么产品建议吗?你先来吧,可以的。我本想让你先说的。让我感兴趣的是像 OpenAI 及其类似产品的市场契合度,它们是否正在为消费者提供有状态的 AI?如果你想说,那种经典的用法,比如汇总我感兴趣的每日新闻,并每天早上发送,或者任何涉及持久性的功能,目前没有任何流行的,或者说主流的 AI 应用允许这种持久性。这很常见吗?
桑达尔·皮查伊: 实际上,听着,我认为你想要赋予用户执行持久、长期运行任务的能力。是的。以一种可靠、安全的方式,你必须深入思考身份、访问权限等问题。但我认为这就是,这就是未来,这就是智能体驱动的未来。将此带给消费者,这就像是我们正在探索的一个令人兴奋的前沿领域。
Elad: 这也是我关注的领域之一。这是 Dreamer,它是 Stripe 公司前任首席技术官的项目,该公司刚被 Meta 收购。我认为他们做出了一个非常好的版本。这是一种非常早期的愿景。
John: 没错,他们当时在制作定制软件,包含持久化功能,而且你还可以进行某种程度的规格定义。
Elad: 你可以自己制作专属的小型应用程序。
John: 完全正确,没错,确实如此。而且他们让这个过程变得非常简单。使用起来,但我感觉当人们有这种体验时,会有一种惊喜和愉悦的时刻,这对我来说很有趣,因为……
桑达尔·皮查伊: 我认为实际上消费者界面底层都将配备完整的编码模型,以及合适的工具框架和相应的技能。还有在云端或本地安全地持久运行的能力,所以所有这些基础原语正在汇聚在一起。那么,开发人员现在的情况是,我觉得世界上有 1%,也许不到 1%,大概 0.1% 的人正生活在这种未来中,他们是在为自己构建东西,但要将其推向大众市场。是的。我认为这是一个非常令人兴奋的前沿领域。
John: 好的,我的另一个产品建议是,抱歉,你必须忍受采访的这一部分。这是必经之路,那是一个线索。完全正确。我的另一个产品创意是因为某种原因,我不知道这是否是你的亲身经历。以我的亲身经历来看,Google Docs 的搜索确实比 Gmail 难用得多。显然,这两个搜索引擎本身同样出色,但我认为问题在于关键词搜索对电子邮件很有效,因为你通常能记住某封邮件中独特的关键词组合。
而我遇到的情况往往是,我想回头查找 2026 年的预算。结果发现,如果我在 Google Slides 里搜索 2026 年预算,这两个词在相关语境下都不是特别独特。因为在 Stripe 的 PowerPoint 文档中也充斥着这些词。所以我总也找不到最准确的那一个。我很好奇,Sundar Pichai 是否也会遇到这个问题?
桑达尔·皮查伊: 虽然我个人的感受没有你描述得那么强烈,但当你描述出来时,我确实产生了共鸣。我正打算去联系负责这一块的人,把这段对话转达给他们。
John: 我很清楚该去找谁,他们就是负责这项工作的人。
桑达尔·皮查伊: 我认为我们可以做得更好。我觉得,AI,集成到这些服务中,包括 Google Docs。我认为在接下来的几个月里,你们会看到显著的改进。我想我们都做过它的最初版本,即只是把它放在某个地方。但我认为,随着时间的推移,你能保持什么在上下文中,你能缓存什么,以及你真正能发挥什么作用?我认为我们可以取得很大进展。所以我认为我们可以做得更好。
工作流转型与 2027 年的转折点
John: 好的。太棒了。我们有很好的额外内容需要应对。
Elad: 很多我参与的公司,甚至是那些因某种理由而创立的公司。最近不得不根据产品开发和工程实践,大幅调整它们的工作流程。他们认为谁应该在设计团队中,以及该团队的能力如何。你们在 Google 是否正在重新审视这一切?你们是否在进行重新思考?在工作流程或其他方面是否有重大的转变?
桑达尔·皮查伊: 我会这样说,你可以把它想象成同心圆。Google 内部有一些团队正在进行更深层次的转变。所以对我来说,一项艰巨的任务是如何将其推广到越来越多的团队,特别是在 2026 年。其中一些工作我们早期无法开展,因为它太容易出故障了,就像你看到了一个充满希望的新世界,但它又处于半瘫痪状态。但今年,我感觉曲线正在发生巨大的变化。
所以我可以看到一些团队,特别是 GDM 和一些 Suite 团队,确实改变了他们的工作流程,而且,他们正在使用——出于某种奇怪的原因,我们对同一款产品在内部和外部有不同的名称——它在内部被称为 Jetski,即反重力。你正身处其中,生活在一个智能体管理的世界里,运用着各种工作流,以这种全新的方式工作,就在上周,我们将其推向了搜索团队。没错吧?所以我们一直在持续推进。在大型组织中,我认为变革管理是这项技术普及过程中非常困难的一环,而这对于小公司来说或许更容易,毕竟小公司可以快速完成转型。
John: 我能否提出几个在人工智能真正普及到工业界时所面临的问题?我也很好奇,你认为我们将在何时以及如何解决这些问题。因为在我看来,我们正面临着巨大的智能过剩(intelligence overhang)。比如,AI 现在在抽象能力方面表现得极其出色。但如果你观察一家 AI-native 公司,或者仅仅观察它们对这些智能的使用程度,你会发现这其中很可能存在缺口。
我所看到的问题大致是这样:首先,工程师要擅长编写 AI 提示词实际上需要一段时间。而且你编写 AI 提示词的水平高低,直接影响到 AI 生成代码的质量。其次,以我们的情况为例,会有很多针对 Stripe 的特定提示词,需要了解应该使用哪些工具。所以,这里既有通用的提示词编写技巧,也有针对 Stripe 业务的特定提示词技巧。再者,显而易见的事实是,共享 AI 生成的代码库非常困难,因为这会带来巨大的影响范围(blast radius),且代码变动极大,代码的周转率很高;在你最终交付产品之前,可能已经重写了多次代码,相比过去代码编写速度较慢的情况,现在多人协作维护同一个代码库变得相当困难。
此外,当你跳出工程领域来看,我所观察到的最大障碍是数据访问权限问题;你希望你的 Agent 能随时获取信息——在世界各地的公司里,人们每天会问多少次“嘿,这笔交易的状态如何?”这属于公司已知的信息,理应由 Agent 自动回答。在 Stripe,我们确实有一些很棒的功能,我观察到它们已经能相当出色地处理这类查询。但无论是使用习惯还是数据访问权限,随着公司规模的扩大,诸如谁有权访问这些数据这类权限管理引擎,所有这些都需要进行配套开发。
接着你会进入角色定义阶段,就像你刚才说的,Eng/PM 设计在某种程度上延续了前一年的思路。在某些情况下,你可能希望将这些角色进行一定程度的合并。随着 AI 在这些方面表现得越来越好,毕竟你已经拥有了产品入口。总之,这就是我对 2026 年情况的描述,模型具备了处理这些事务的能力,但我们的使用程度依然有限。你认为这种智能的普及应用会呈现什么样的面貌?
桑达尔·皮查伊: 我们很多人正在致力于此,比如 Gemini 团队、Gemini 企业团队以及 anti-gravity 团队,他们就在精准地研究这些问题。这就是你所说的路线图,没错,我们实际上正在内部使用它,在遇到这些障碍时,会设法寻找解决路径。所以,这就是正在发布的产品。我们仍在对其进行推广,因为当你作为 Google 的 SRE 团队成员使用它时,你会突然发现某些部分可以创建自动化工作流。所以这种情况正发生在这些领域,但如果在培养技能时进行更系统化的处理,这些技能将如何实现中心化,又该如何供模型及所有人使用?
身份访问控制确实是非常棘手的问题。我们正在努力解决这些问题,但这些也是限制我们实现普及的关键因素。没错。我们对安全性非常重视,因此我们必须这样做。没错。所以这是额外增加的一层。在所有这些之上,还有运行这些服务时犯错所带来的成本。所以我们必须克服这些困难。但我认为正因如此,当我们解决这些问题时,我们将以更稳健的方式将其实现,这会有所助益。所以我感觉我们现在正处于承担这一固定成本的阶段。但当你看到我们将这些能力应用到外部环境时,你会发现人们所能做的事情发生了巨大的飞跃。其他人也在这样做。而且以一种更稳健的方式,这些模型正在不断进步。
John: Google 每年会进行几次正式的业务重预测。我想至少在 Stripe 我们是这样做的:我们会设定年度预算,然后每年进行三次正式的重预测。当你思考这个问题时,重预测是一个基于特定时间点的函数,你获取业务的状态——其中一些存在于人们的脑海中,但大部分都记录在案——比如这个产品表现如何,那个产品表现如何?这笔交易会达成吗?那件事会发生吗?诸如此类。所以,存在一个业务的时间点状态,我们将其输入到一个函数中,输出的就是该年度更新后的财务数字。你可以想象 AI 能够完全无需人工干预地进行预测。你认为 Google 在哪个季度会实现首次完全由智能体完成的预测?
桑达尔·皮查伊: 我非常确信在其中一些领域,27 年将成为某些事物的关键转折点,即便是对于从业者而言,这也将是他们完成产出的工作流方式。而且,也许在一段时间内你还会沿用传统方式进行核查,但你会经历一种转变,一种交叉切换。但我预计 27 年将是重大的一年,其中一些转变会发生得非常深远。
John: 我认为这正是 Eng 作为早期采用者提出的问题,尽管这有点超出 Eng 的范畴。听起来你认为到了 27 年,许多非工程类流程将真正开始提速。
桑达尔·皮查伊: 我确实认为你之前的问题,比如,你是在探讨更多机器人技术相关公司的背景下提出的。我确实认为那些公司,这就是初创公司将具备的优势之一,即拥有更多 AI-native 团队。而且,你或许可以通过面试流程等方式来了解这一点。
John: 而对于我们来说,我们则需要进行再培训、转型等等。
桑达尔·皮查伊: 我认为这或许是年轻公司将具备的优势。而我们必须,去推动这种转型。
John: 最后一个问题。我们聊了很多在 Google 内部起步较小的项目,比如 Transformer,当这些项目刚启动时,它们并非 Google 的核心优先级。目前在 Google 内部,有哪些让你感到兴奋的小型项目?
桑达尔·皮查伊: 这可能会让人感到惊讶,比如,当我们决定建设太空数据中心时,我们也是从一个非常小的团队开始的,所以,那真的是只有几个人,带着很少的预算去实现第一个里程碑。因此我认为,即便是一个宏大的想法,也要从起步开始。这就是一个小型项目的例子。
昨天我确实花时间听了一个关于训练后阶段改进的说明,这就像是一个人在讲述他们正在做的改进,听过之后,我心想,噢,那真的会让我们看到一个相当不错的跨越。这就是这个时代持续不断的动力所在。关于第二点,我不想透露具体细节,但我相信未来某一天我们会将其公布出来的。虽然如此,但这些是我感到兴奋的一些小跨越。
John: 比如太空中的数据中心以及新的 ML 技术。
桑达尔·皮查伊: 是的。是的。
John: 很棒的回答。谢谢你。
精彩评论