一位顶级科技投资人的AI全景洞察:台积电不扩产,AI就无泡沫
按:之前有朋友问我:做AI投资,哪些投行研报值得关注?依我之见,这就像让传统分析师点评地缘冲突——在AI这样快速演进的前沿领域,投行研报往往只是二手信息的汇总。真正有价值的一手洞察,来自AI生态核心参与者的直接发声:OpenAI、xAI、谷歌、Cursor、Fireworks、Bain等公司的负责人,以及黄仁勋、埃隆·马斯克、Daario这类深度塑造行业格局的关键人物。而这些高质量对话,恰恰就藏在硅谷最顶尖的播客节目中。
比如上周分享的文章(Anthropic首席财务官万字访谈实录:千亿美元算力内幕)就可以从AI实验室的最上游视角了解其对算力支出的展望。今天这篇文章同样来自播客《Invest Like The Best》,这次主持人帕特里克·奥肖内西(Patrick O'Shaughnessy)邀请加文·贝克(Gavin Baker)深入剖析该如何投资这场前所未有的人工智能技术热潮。
Gavin Baker 是一位美国知名科技投资人,现任对冲基金 Atreides Management 的创始人、管理合伙人兼首席投资官(CIO)。他因早期重仓投资 SpaceX、Uber、Snapchat 等高成长科技公司而广受关注。擅长从技术演进、资本配置和产业格局变化中识别长期投资机会。截至2026年,Atreides Management 管理资产约70亿美元
在对话中,Gavin直言Anthropic单月新增110亿美元ARR,“是资本主义史上、美国商业史上最非凡的时刻”——其增长速度远超SaaS革命十年总和,彻底重塑了我们对指数级扩张的认知。
他强调,当前AI投资的核心矛盾在于基础设施瓶颈:“电力与晶圆”正成为决定产业格局的关键。而解决之道不仅来自地面——SpaceX构想的“轨道计算”(orbital compute),即将Blackwell机架送入太阳同步轨道,用激光互联构建太空数据中心,可能在未来两年根本性缓解算力与散热限制。与此同时,台积电的产能决策被Baker称为“抑制AI泡沫的关键阀门”;若非其刻意维持晶圆短缺,市场恐已陷入由过度建设引发的崩盘。
Gavin犀利指出,AI经济回报高度集中于“前沿模型”,开源方案难以撼动闭源巨头,原因在于“苦涩教训”(bitter lesson)依然有效:算力终将压倒算法巧思。他警告,违背这一原则是“AI领域最大风险”。此外,AI正从“无限套餐”转向“按需付费”,企业用量定价将推动OpenAI与Anthropic ARR突破2000亿美元,但也加剧了“只有富人才能触及前沿”的反乌托邦隐忧。
在巨头点评中,他盛赞扎克伯格将Meta真正转型为“AI优先”公司,肯定萨提亚押注自研算力的战略勇气,并预言Terafab晶圆厂——由SpaceX与英特尔合作打造——或在美国本土重构半导体权力结构。
最后,Gavin以武士与机枪的隐喻呼吁投资者:“机枪已经来了。如果我们不能都成为机枪大师,就会被机枪主宰。”总之,对于任何投资AI领域的人来说,这都是一期必听的对话。
以下为正文,全文两万字,预计阅读时间1小时,供感兴趣的朋友参考:
一、史无前例的增长:Anthropic的ARR奇迹
主持人(Patrick O'Shaughnessy):这已经是我们第六次做这个节目了,这让你重回第一的位置,或者至少与Girly并列第一。而且我认为,即使从我们上次做这个节目以来——那期节目就已经非常激动人心和精彩绝伦了——我们现在所处的时代甚至更加有趣。也许你可以先聊聊,对你而言,亲身经历今年三月和四月是什么感觉?
Gavin Baker:我会说,广义上讲,有两种类型的回撤。一种是你错了,比如误判了形势,你的假设被证伪了,你必须认亏止损,并将损失变现。另一种回撤或表现不佳的时期,则是因为那些你非常了解的公司,你对其价格走势深感不认同,这时你反而可以加仓,而不是去确认亏损,从而积累起潜在的阿尔法收益,也就是未来的超额回报。对我而言,三月就是这种感觉。当时纳斯达克在抛售,但与此同时,AI领域正在发生的事情,我认为是资本主义史上、美国商业史上最非凡的时刻。
我所说的这一点,具体是指Anthropic新增了110亿美元的ARR。让我感到震惊的是,SaaS和云计算革命创造了大约5到10万亿美元的价值。可以说,在过去10到12年里成立的三家最具知名度的SaaS公司就是Palantir、Snowflake和Databricks。这三家公司总共雇佣了成千上万的员工,花了十年时间打造业务。而Anthropic在一个月内就新增了相当于它们总和的业务量。资本主义历史上从未发生过这样的事情——我说的不是我的职业生涯,而是整个资本主义史、整个商业史。
所以,这完全没有先例。我们这些科技投资者,经常听到关于S型曲线和投资指数级增长的讨论。但我从未见过像这样的指数级增长。它甚至比DeepSeek那次还要极端。
那确实是一个非常相似的局面。如果我们回到2025年,当时DeepSeek引发了一次巨大的抛售,这很奇怪,因为那篇论文是在DeepSeek周一发布前7天发表的。我记得那篇论文好像是在一个美国的假日发布的。我读了之后心想,这对AI交易可能不是个好消息。于是我采取了行动。我们在“DeepSeek周一”那天看到AI板块真正崩盘,一周后情况变得非常奇怪,因为亚洲AWS可用区的价格已经翻倍,GPU的可用性急剧下降。那是我们第一次看到,与非推理模型相比,推理模型在推理阶段对算力的渴求要大得多。
所以那是个类似的布局,但你当时需要做一些功课才能看清。我的意思是,看到股价抛售、但DRAM价格飙升、亚洲GPU价格飙升、GPU可用性下降,其实并不难。然后两三天后,美国的GPU租赁价格也涨了。而在三月,你只需要简单地观察Anthropic身上发生的事情就够了。
有很多人似乎都在后悔:后悔在2022年没买,后悔在疫情期间没买,后悔在DeepSeek时没买。你在四月初又遇到了同样的估值环境,而且AI的拐点信号甚至更加清晰。所以,市场上一直都有买入AI的机会。当然,后来是霍尔木兹海峡事件。
我成了一个信徒,现在依然是。我认为市场可能错误定价的一点是——我不是宏观专家,但我确实做了很多与国家安全相关的投资,因此我能接触到一些专家,他们乐于与我分享他们的想法和观点——霍尔木兹海峡关闭对美国来说实际上相对有利。
主持人:为什么?
Gavin Baker:因为这尤其符合本届政府的目标。电力是非常重要的工业或制造业投入。影响美国电价(进而影响AI成本)的关键因素是天然气。彭博数据显示,美国天然气价格下跌了20%,而亚洲、欧洲和其他地方的天然气价格则翻了一番甚至两番。因此,我们的相对制造业竞争力一夜之间就得到了提升。无论好坏,这正是特朗普政府似乎关心的。他们非常关注美国的相对地位。
我认为很多人还记着1970年代。70年代之所以如此创伤性,不仅仅是因为价格上涨,更是因为出现了实际的汽油短缺。但当你仔细分析就会发现,美国经济的能源密集度已大幅降低,美国现在是全球最大的石油和天然气生产国,并已成为全球最大的石油和天然气出口国。再加上这种相对的制造业优势,这使得我们更容易专注于AI的基本面,专注于那些从历史角度看极具吸引力的估值。从相对角度来看,科技股相对于市场其他部分的估值,已经达到了过去十年中的极低水平。
想想市场有效性这个背景:我们正处在资本主义史上最非凡的时刻,这对AI是极度看涨的,而你却有机会以极具吸引力的估值买入AI。
主持人:你怎么看待Anthropic和OpenAI的估值倍数?在我看来,这两家公司就像是这一趋势中最纯粹的参考资产,而它们的估值倍数其实并不算离谱。如果你只看市销率,并将其与Databricks、Snowflake等公司在巅峰时期的估值进行比较,你会怎么理解?
Gavin Baker:我认为OpenAI和Anthropic从资本效率的角度看是截然不同的动物。Anthropic的每个token成本显然远低于OpenAI。这一点从它们烧钱达到大致相同收入规模所花费的金额就能看出来。我认为Anthropic的烧钱额可能比OpenAI少了80%。因此,作为企业,它们显然有着非常不同的结构性ROIC(投入资本回报率)。我认为OpenAI正在做很多事情。我认为Sarah Frier是最杰出的CFO之一,他们正在做很多事情来试图改善这一点。
而且他们已经锁定了大量的算力。这是另一个巨大的差异。事实证明,激进的策略确实得到了回报。但话说回来,Anthropic以9000亿美元的估值对应500亿美元的ARR,并且还在以1000%的速度增长。也许一个真实的说法是,如果Anthropic拥有所有算力,他们今天的收入可能会远超1000亿美元,也许是1500亿。
而且,众所周知,他们已经显著提升了Claude的智能水平。有分析显示,即使是Opus版本,Claude在回答完全相同的问题时,生成的token数量也减少了70%。正如我们上次谈到的,在某种程度上,token数量等于答案质量和思考质量。当然,每个token的智能密度也很重要。作为一名用户,我也感受到了这一点。所以我认为如果算力不受限制他们的收入可能会实质性地超过1000亿、1500亿,甚至可能是2000亿。
主持人:那么为什么他们不以3万亿美元的估值融资1000亿美元之类呢?如果你是Anthropic的CFO,Krishna很棒,我们刚请他上过节目(详见:Anthropic首席财务官万字访谈实录:千亿美元算力内幕)。那期节目后我认识的每个人都在试图投资这家公司。
Gavin Baker:我认为这是明智之举。未来充满不确定性。你显然身处一个资本密集型的游戏,即使你是Anthropic。我敢肯定,Anthropic目前的推理业务毛利率已经是正的,今年可能就会开始产生现金流。尽管如此,你可能还是希望有能力筹集更多资本、获取更多算力。
我想到埃隆·马斯克,他总是能让投资者赚钱。他视之为一种神圣的契约。正因为如此,他在过去20年里一直让投资者赚钱,他拥有了超能力。这种能力就是,他基本上可以在任何时候、以任何规模筹集到他想要的资本。我确实认为,专注于让投资者赚钱是明智的,这带来的好处不会只持续一两年,而是可以持续未来二三十年。
主持人:埃隆做到这一点的方法,似乎是系统性地压低SpaceX或其他公司的估值。具体方法是什么?
Gavin Baker:就是永远不在估值上贪婪,永远不推高估值。就这么简单。我的朋友Antonio指出,SpaceX在过去十年里以略高于30%的复合年增长率增长。我认为这是因为埃隆专注于保持这种“超能力”,并在投资者和员工之间努力寻求公平的平衡。我认为这是明智的。但Anthropic能否以比最新传闻估值高出至少100%的价格融资呢?当然可以。
二、轨道计算将在未来两年解决电力短缺问题
主持人:让我们进入沃森晶圆(Watson wafers)的讨论部分,这一直是我和你聊天时最喜欢的话题。我总觉得,每当我感觉基础设施建设已经过热时,下一次和你聊,你就觉得我们本该做得更多。你研究过S型曲线及其陡峭程度,也懂很多历史。谈谈你今天如何看待沃森晶圆,将其视为这一切的关键输入。
Gavin Baker:我会说,我认为资本主义将解决电力短缺问题,除非出现重大的监管或政治反弹,而我认为这种可能性是真实存在的。一家大型私募股权公司(比如黑石、Apollo或KKR)的数据中心基础设施投资负责人曾说过:“过去,能源和芯片是我们最大的瓶颈。现在,更重要的是分区规划和审批许可。”
我认为很多公司都在等待中期选举后再采取行动,比如进行裁员。没人想在中期选举期间成为众矢之的。但你已经看到,许多制造涡轮机的公司都宣布了大幅增加产能的计划。西方已经有80年没有制造过能铸造这些大型叶片的机器了,我们已经不知道如何制造它们了,等等。所有这些都是事实。我绝不是要低估其中所涉及的工业工程,但资本主义非常擅长随着时间的推移解决这类问题。
除了这些涡轮机,还有其他能源来源,只是时间框架更长。因此,我认为电力短缺问题可能会在2027或2028年开始缓解,而轨道计算(orbital compute)将真正解决这个问题。
我想重新定义一下轨道计算,因为当人们听到“太空数据中心”时——这是我们上期节目讨论过的——他们会想象一个五角大楼大小的建筑漂浮在太空中,然后说:“我们做不到,那不可能。”但事实并非如此。一个Blackwell机架重约3000磅,高8英尺,深4英尺,宽3英尺。那就是太空中的卫星。SpaceX已经展示了一张示意图,就是一个机架。它大概有Blackwell机架那么大,两侧有大约500英尺长的太阳能板翅膀。你把它放在太阳同步轨道上,这样太阳能板就始终沐浴在阳光下。由于它处于精确的太阳同步轨道上,其后方延伸数百英尺的散热器也能有效工作。
主持人:这是一个常见的批评。是啊,你怎么解决散热问题?
Gavin Baker:我这些年在星港(Starbase)待了很多时间,和很多SpaceX工程师聊过。我认为他们是地球上最有才华的工程师团队,他们非常有信心已经解决了这个问题。他们并非总是如此自信。例如,要把星舰(Starship)变成火星殖民运输船,可能还需要一些工程突破。他们能做到吗?绝对能。但他们目前更关注什么?我认为可能是维修和维护。
这两个是最大的问题:散热器,以及如何修理机架里出问题的地方。答案是,在你拥有漂浮的Optimus机器人之前,你没法修。不过,我认为星舰将以前所未有的方式改变太空经济。特别是如果地面数据中心受到监管限制,那么一切都不重要了——你能造多少轨道算力,就能卖出多少。
显然,你会用激光将这些机架连接起来,而激光在真空中传播,这已经是每颗星链(Starlink)卫星的标准配置。这让我感到震惊的是,SpaceX运营着世界上最大的卫星舰队,占轨道上所有卫星的98%或99%。他们今天就在给星链降温。我认为星链V3的功率将达到20千瓦。而一个Blackwell机架只有100千瓦。人们经常谈论密度问题。但在太空中,如果你用真空中的激光连接机架,你就可以把机架做得更大。你关注的是重量,而不是尺寸。
在地球上的数据中心,你试图用铜缆连接机架,要尽量缩短距离,布线成本很高。你希望机架小一些,因为能用铜缆就用铜缆,实在不行才用光缆。但在太空中,SpaceX可以做很多那些纸上谈兵的怀疑论者想不到的事情。他们运营的卫星比任何人都多。他们今天就有20千瓦的卫星,所以也许你可以先把它扩大到60千瓦。他们似乎非常有信心能直接做到100到120千瓦。
而且,同一家公司现在也运营着地球上最大的数据中心。他们拥有世界上最顶尖的硬件工程师。几乎所有不够聪明或不够务实、无法在SpaceX工作的人,都成了这些坐在扶手椅上的怀疑论者。
我不想引用拉里·埃里森的话,但有人表示怀疑时,拉里就说:“听着,他在那里成功回收火箭。我没看到有别人能做到。事实是,十年过去了,没有其他公司能持续地着陆并完全重复使用轨道火箭。如果没有可重复使用性,这一切都没有意义。这意味着你必须能着陆它。”
我想重新定义轨道计算:它是太空中的机架,而不是漂浮在太空中的巨型五角大楼式数据中心,那太荒谬了。但你可以做到,因为数据中心的本质就是用激光连接这些机架。所以,它将是通过激光连接成一个虚拟数据中心的太空机架。
如果你设想一下那样的世界,假设这一切都实现了,我们真的能经济高效地把这些东西送上天,在太空中到处进行矩阵乘法运算。这对地面数据中心意味着什么?有人曾说过,美国会尽其所能地汲取它能得到的每一种能源。我认为对算力也是如此。
这就是为什么我可能不像以前那样担心边缘AI的前景了。我们会尽可能多地消耗算力。我认为推理任务非常适合轨道计算。训练任务在很长一段时间内仍将在地球上进行。所以,我不认为这对地面数据中心是特别利空的。我认为在我有生之年,它们都将是有价值的。
但我确实认为,如果你身处发电和冷却生态系统中,并且正在大规模提升产能,而你知道很多这样的产能扩张恰好会在所有那些愚蠢的怀疑论者开始明白轨道计算非常真实的时候上线,那么你真的需要认真思考一下。与此同时,还有很多酷炫的事情在发生,比如我们正在非常擅长改造喷气发动机。你知道,有一家叫Boom Aerospace的公司就在做这个。
所以,资本主义正在努力解决瓦特(电力)问题。
三、台积电的产能决策是抑制AI泡沫的关键阀门
Gavin Baker:至于晶圆(wafers),那就完全是另一回事了。这是一群在台湾的、意志坚定的老派人士,他们是台湾最重要的人物。他们占据了该国GDP、用水量、用电量的绝大部分。他们谈论着“硅盾”。他们都视自己为摩里斯·詹(Morris Chang)神圣遗产的继承者。
我清楚地记得,20多年前我参观科学园区时,曾问他们:“你们觉得能赶上英特尔吗?”他们说:“这是一个非常美好的梦想,但这是留给我们的子孙后代的梦想。”
而他们做到了。部分原因是英特尔自己的问题,但更重要的是,他们的思维方式完全不同。这也是为什么黄仁勋(Jensen)如此频繁地飞往那里的原因之一——他希望他们扩大产能。
我认为有一点很疯狂:黄仁勋从未与台积电(TSMC)签过合同。他们的生意似乎仅凭握手和公平感就做成了。“长期来看,这将是公平的。我们是合作伙伴,我们会彼此公平对待。”事实上,根据以往所有基础性新技术(如AI)的市场先例,总会有一个泡沫。卡洛塔·佩雷斯(Carleta Perez)写过一本关于这个的精彩著作。基本上,市场是有效的,它们能正确理解这是一种基础性技术。
莫比森(Mobison)称之为“多样性崩溃”(breakdown in diversity)。所有人都对这项新技术变得乐观。我开始有点担心出现多样性崩溃。然后就会产生泡沫。这个泡沫为这项新技术的建设提供资金,但供应会超过需求,于是就会发生崩盘。如果这种建设是由债务驱动的(比如2000年),崩盘就会特别严重。
我真正感到高兴的一点是,当前的建设仍然主要由经营性现金流资助,这是与2000年的一个根本性区别。另一个根本性区别是,如今每块GPU的利用率都是100%,而2000年时99%的光纤都未被使用。所以存在所有这些根本性的差异,但我们必须记住,历史不会重演,但会押韵。作为投资者,我们必须对此有清醒的认识,并认识到,在过去两三百年里——别提互联网泡沫了——这种情况总是会发生。
我们历史上有过铁路泡沫、运河泡沫,所以我们理应预期也会出现一个AI泡沫。而这令人恐惧——没人想要泡沫,泡沫是可怕的。之所以可怕,是因为如果你对估值敏感,你就会大幅跑输市场,很可能被所有客户解雇。乔治·范德希登(George Vanderhiden)——这位已故的富达(Fidelity)传奇基金经理——在1999年对抗泡沫,最终于2000年初退休,我想就是因为他实在无法忍受了。
他深知那是错误的,而他的客户们却深表怀疑:“乔治,你落伍了。”他当时已是满头白发,是一位真正伟大的人物。我只与他短暂共事过,但他对我好友兼导师詹妮弗·尤里克(Jennifer Urick)而言,是一位非常重要的导师和朋友。因此,我从她身上继承了很多范德希登的“基因”。正是他提出了那句名言:“过早入场和犯错是一回事。”乔治因为无法忍受持续跑输、无法忍受客户质问“你怎么回事?你不懂吗?”而选择退休。他当时持仓中约40%是烟草股,40%是住宅建筑商。结果在接下来的三年里,他可能跑赢纳斯达克20到30倍。
现在,我一直乐观地认为,晶圆(wafers)的根本性短缺——目前实际上由台积电(Taiwan Semi)控制——将阻止泡沫的形成。如果台积电听从黄仁勋(Jensen)的意愿,我认为英伟达(Nvidia)在2026或2027年可能卖出2万亿美元的GPU,也许是2.5万亿,甚至3万亿美元。但总会有一个临界点:当消费者消耗算力的速度快到一定程度时,就可能出现过度建设。因此,如果我们最终没有出现泡沫,我们应该为台积电举办一场庆祝派对,因为他们单枪匹马地阻止了泡沫。
主持人:你现在已经开始看到一些公司转向英特尔(Intel)和三星(Samsung)了。假设台积电继续保持极度供应受限的状态,远低于潜在需求,那会发生什么?
Gavin Baker:在市场历史中,英特尔和三星这两家中,总有一家不会保持纪律性。他们会率先打破限制,然后在某种程度上迫使其他所有人都跟进。所以,这很大程度上可能取决于台积电能在多大程度上维持对英特尔和三星的领先优势。你要记住,这个领先优势大概是9到12个月,甚至15个月。
主持人:你是说制程节点的领先优势?
Gavin Baker:没错,就是他们扩产的速度。如果要我关注一件事来判断是否会出现泡沫,那就是台积电的产能决策。我认为存在一个“金发姑娘区间”(Goldilocks zone):他们扩产的幅度足以让英特尔或三星难以真正成为具备规模化能力的第二供应商(市场份额远高于30%),同时又能维持晶圆的根本性约束,从而帮助我们避免泡沫。显然,我认为Terafab(特拉法布)也将在这其中扮演重要角色。
主持人:能为不了解的人多说说Terafab吗?
Gavin Baker:Terafab是SpaceX(我相信特斯拉也参与其中)的一家合资企业,旨在美国本土建造全球最大的晶圆厂。我认为他们会成功。他们与英特尔建立了非常重要的合作伙伴关系,因此他们能获得英特尔50年的机构知识积累。虽然他们在技术上可能落后前沿几个季度,但这反而是一种优势。此外,我相信Terafab会吸引所有半导体设备公司的“A团队”关注。台积电当年能快速崛起的一个重要原因,就是ASML、KLA-Tencor、Lam Research和应用材料等公司都不希望市场上只有一个买家(monopsony),于是派出了最顶尖的工程师团队常驻台湾。英特尔犯了一些错误,于是台积电迅速崛起。
现在,由于马斯克在硬件工程领域的声誉,“A团队”将会来到这里。在美国,政治已经取代了宗教,而埃隆因涉足政治,让一些美国人难以客观看待他,这很遗憾。因为我认为,他可能比任何其他美国人都为美国做了更多贡献:他单枪匹马地将制造业带回美国;他复兴了“国防科技”(Dince Tech);SpaceX在某种程度上是美国最重要的国防承包商;他在星链(Starlink)上的成就对世界意义非凡;他创造了大量蓝领制造岗位——这其实是许多自由派人士的目标,对美国大有裨益;他在推动全球脱碳方面的贡献,超过任何在世之人。如果你因为地面数据中心的环境问题而感到不安,那么Terafab正是解决方案。可惜的是,在美国本土,人们难以看清这一点,但在中、台、韩、日,他被视为活着的神明。
长期观察他,你会发现他会招募最优秀的人才——因为顶尖工程师都想为埃隆工作,尤其是在硬件工程领域。他会招募不可思议的工程师。然后,在Terafab旁边,他会建一个“台湾城”:“这些是你最喜欢的餐厅,我要把它们连同整个员工团队从台湾搬到得州,我们会按你们喜欢的方式重建一切。”接着会有“日本城”,同样操作;再建“韩国城”……他会精准地打造这些社区,只为吸引最顶尖的工程师。而英特尔和三星的管理层根本不是这样思考问题的。因此,他将拥有最顶尖的人才、半导体设备公司的“A团队”,以及与英特尔的重要合作——这对任何一届政府的政治目标都极为有利。而且,这种模式足够差异化,不会疏远台积电。
主持人:这些项目都有很长的前置时间,对吧?所以Terafab要开始大规模生产英伟达GPU或其他芯片,还需要相当长的时间。
Gavin Baker:埃隆做事的方式总是与众不同。别人建一个数据中心要三年,他122天就建成了。三星不得不在得州的晶圆厂里给他专门设一间办公室,因为他对他们扩建厂房的速度极度不满。我们拭目以待。
四、违背“苦涩教训”是AI发展的最大风险
主持人:你之前提到DeepSeek,当时一个简单的反应是:“好吧,这些模型只需极小一部分成本,就能达到95%的效果,尤其是那些中国开源模型。我们以后大部分任务都可以用它们完成。再过两年,我这个小公司就不用每年花100万美元在token上了。”但现实似乎与这种预期大相径庭。我很想知道,你认为这种认知偏差背后的原因是什么?
Gavin Baker:我认为这非常有趣:在模型层,AI产生的经济回报几乎全部集中在前沿模型(frontier models)上。这一点让我感到惊讶,也让很多人感到意外。作为投资者,你必须对此形成自己的假设:前沿token是否会继续攫取模型层创造的绝大部分经济价值?我还记得Gemini 3.1 Pro刚发布时,我觉得它惊艳绝伦,但现在却已完全无法忍受。
当然,可能存在一种动态:公司先用前沿模型做原型开发,等到投入生产时,很多人会选择Vertex或开源模型。但事实是,今天绝大多数经济回报仍然来自前沿token。这很反直觉。至于这种情况是否会持续,我认为是一个非常值得探讨的问题。经历了Gemini 3.1和Opus之后,我对这个问题更加开放。
我目前使用Groq 4.3,它处于“帕罗前沿”(Paro frontier)——即智能与成本的最优边界。如今处于这一前沿的公司,与我们上次讨论的情况相比已有重大变化:谷歌因在TPU V8上做出过于保守的设计决策(试图部分摆脱博通和英伟达),失去了其每token成本的领导地位;而英伟达则持续采取激进策略。九个月前,谷歌主导着帕罗前沿——在该曲线上每个点都优于OpenAI、xAI和Anthropic。如今,帕罗前沿已被Anthropic和OpenAI主导,Groq 4.3也位于前沿(显然是目前性价比最高的5000亿参数模型),而Gemini 3.1则勉强挂在边缘。我甚至怀疑谷歌是在靠补贴维持其地位。
我认为,违反理查德·萨顿(Richard Sutton)的“苦涩教训”(bitter lesson)绝对是这项投资、乃至整个AI领域最大的风险。“苦涩教训”的核心是:利用大规模算力的通用方法,最终总是以巨大优势胜过依赖人类领域知识的特定方法。“苦涩”是因为它打击了人类的自尊心,因此越接近AI的人,越不相信这种风险会发生。我认为三月市场疲软的部分原因,就是出现了一个比DeepSeek更愚蠢的东西——“TurboQuant”。这是谷歌一年前在一篇论文中提出的内存优化技术。在谷歌正与美光、三星和海力士谈判签订长期协议(LTA)、锁定长期高价的关键时刻,他们突然公开了这项技术。人们的行为永远比言语更重要。他们在X平台上简单宣传了一下,立刻病毒式传播:“天啊,DRAM需求完蛋了!看这个DRAM优化方案!”但我找不到地球上任何一个AI工程师相信TurboQuant会对DRAM需求产生任何影响。
尽管如此,违反“苦涩教训”——即相信人类算法巧思能超越算力堆砌——确实是一个真实的风险。而那些正在构建模型的人恰恰对这一风险持怀疑态度。我之所以不那么怀疑,是因为我认为我们已非常接近超级人工智能(ASI)。谁知道“苦涩教训”是否适用于400 IQ的模型?也许我们会进入一个短暂的时期:一旦达到ASI,它的首要目标可能是变得更聪明、获得更多资源。如何实现?通过提升自身效率。我认为这确实是一个风险——“苦涩教训”字面意义上就包含了人类。我们将很快验证这一点:它是否适用于300 IQ的AI?400?500?600?在某个时刻,我们可能会因AI/ASI而短暂地违反“苦涩教训”。
主持人:我很好奇,你怎么看待模型创新中的其他方面?比如持续学习(continual learning)和记忆(memory),这两点似乎是人们最关注的、可能催生全新范式的方向。你怎么看它们的作用?
Gavin Baker:我认为我们已经通过“驾驭层”(harnesses)在记忆方面做了很多工作。“驾驭层”虽不如模型本身重要,但影响巨大。如今,这些驾驭层与模型越来越协同开发。你可以把驾驭层想象成模型运行的“运行时环境”(runtime),它知道工具池在哪里,能创建上下文、记忆、状态,提供非常具体的提示或指令,从而产生巨大差异——即使是简单版本,效果也令人难以置信。
上次我在这里时就说过:“作为投资者,你必须付费使用250美元/月的版本,才能直观感受前沿AI的能力。”但现在,即使对于非编程用途,你也需要Cloud Code或CodeEx,并且必须使用企业版计划。原因在于:随着谷歌失去成本领导地位,AI模型已全面转向基于用量的定价模式。如果你使用250、280或300美元/月的个人计划,你会受到严重的速率限制,得到的是“阉割版”AI。正如我们之前讨论的,Claude现在生成的token减少了70%。如果你想获得Claude及其驾驭层认为回答问题所需的完整token量,就必须使用基于用量的企业计划。
顺便说一句,这对AI行业是极度看涨的信号。我在2005-2007年做过电信分析师,当时移动通信在过去十年一直是高增长行业,原因在于它结合了固定套餐(比如900分钟)和超额用量计费。后来当所有人都转向“无限套餐”(all-you-can-eat)时,移动通信就不再是一个高增长行业了。长途电话也是如此。AI正在从“无限套餐”转向“按需付费”(pay-by-the-drink)。事实证明,人们非常喜欢打长途电话,非常喜欢用手机聊天,也极其喜欢使用AI——尤其现在一个人可以拥有100个AI代理。因此,我认为转向用量定价模式,可能是OpenAI和Anthropic今年ARR将远超2000亿美元的原因:不仅更多算力会上线,它们还能通过企业用量模型推高前沿token的价格。但这对世界来说是悲哀的——这意味着如果你负担不起,就无法触及前沿。至于持续学习,如果真能解决这个问题……
主持人:你如何理解“持续学习”?人类心智有太多未解之谜。我们在样本效率上远超AI——AI需要的数量级比我们高得多。
Gavin Baker:是的,高出好几个数量级。今天我们有一种粗糙的持续学习变体,仅限于可验证的场景,即训练中期的强化学习(reinforcement learning)。但真正的持续学习,是指模型能实时动态调整其权重。就像人类一样。
比如我第一次把手伸进火里,我就学会了再也不这么做。而今天的模型需要把手伸进火里一百万次,然后由设计者在下一次训练或RL训练场中人为加入“火”这个元素,它才能学会。我认为它必须能动态更新权重,不过人们已经在研究超越这一点的更聪明技术。如果我们真能实现这一点,就会迎来极快的起飞。人们似乎普遍相信,持续学习就在眼前。我认为这是第三个关键问题:1)ASI(或不太可能的人类巧思)是否会导致“苦涩教训”失效?2)前沿token是否还能维持当前的溢价?3)我们能否实现持续学习?如果能,何时实现?
主持人:在这一切中,新兴芯片公司扮演什么角色?我们谈了很多英伟达、它与台积电和英特尔的关系等。现在可谓“百花齐放”——可能真的有上千家公司在尝试设计新芯片,以解决某个瓶颈。我很想知道,你如何看待这个领域的机会、它们将扮演的角色?
Gavin Baker:我认为这对世界是好事,对黄仁勋也是好事。因为不同政府可能持不同观点,竞争对所有人都有益。在坦克设计中,有个概念叫“铁三角”(iron triangle):设计师必须在攻击、防御和机动性之间权衡。显然,装甲(防御)越多,坦克越重,机动性就越差。因此你必须在这个三角形内做取舍。比如以色列的梅卡瓦(Merkava)坦克侧重防御,而俄罗斯和豹式(Leopard)坦克更侧重机动性。
芯片设计同理。你必须在台积电设计规则所规定的物理定律约束下生存。目前,TPU、Tranium和AMD本质上都在试图打造更好的GPU。我认为Tranium目前做得最好。没人能造出比英伟达更好的GPU,但Tranium确实在“挑战超人”(tugging on Superman's cape)。不过Tranium 3尚未量产,它需要搭载交换机扩展网络(switch-scale-up network),这对经济高效的推理至关重要。很多公司采用Taurus架构,包括谷歌和AMD。MI450的情况还不清楚。我们可能对Trinium 3的了解多于MI450,但这仍是一场艰难的竞争。
因此,初创公司必须另辟蹊径,而且这条路径本身也必须很难走通。我的经验法则是:1%的市场份额就值1000亿美元——这是一个相当不错的风投回报。黄仁勋可能会说:“如果有人做出了不同的东西,并获得了1%-3%的份额,我们就会自己造这种芯片。”所以,如果你只是想造一个更好的GPU,祝你好运。如果你做的是不同的东西,那它也必须很难复制。
此外,预填充(prefill)和推理(decode)的分离,为芯片设计打开了新的可能性。你可以针对decode做激进的权衡,也可以针对prefill做激进的权衡。Prefill是指接收上下文,decode是指生成输出。
我有位名叫安德鲁·福克斯(Andrew Fox)的同事曾比喻:“想象一艘18世纪的英国战舰。Prefill是装填炮弹,decode是开火。”Prefill本质上是模型理解问题和提示,并跟踪自身的解码状态——这是一个内存容量受限的问题。而Decode是生成新token的过程,受内存带宽限制。
因此,作为芯片设计师,你有了更丰富的画布。但即便如此,你的权衡也必须足够难。如果你在“铁三角”中为优化内存容量而做出的权衡很容易复制,那么英伟达就会立刻跟进。他们在台积电拿到的价格比你永远都拿不到的更好。祝你好运吧。而且,他们与每一家模型公司合作,能优化自己的设计。
顺便说一句,另一件非常有趣的事情是:如果你是一位风险投资家(VC),而你投资的半导体公司告诉你,他们将因为拥有台积电某项制程的“特殊权限”而获得优势——我向你保证,黄仁勋早在台积电刚有这个想法时就看到了这项制程,他对它的了解远超一家只有200人的小公司所能想象的程度。台积电、CMI以及整个供应链中的所有人,都会像向亚马逊、AMD、TPU展示一切那样,向黄仁勋展示所有东西。这也是另一个原因:不要试图去造一个更好的GPU。
所以,你可以做点不同的事。你可以在预填充(prefill)画布上作画,也可以在解码(decode)画布上作画,但你还必须做一件困难的事,因为一旦你的技术达到规模化,那四家公司(英伟达、AMD、谷歌、亚马逊)就会迅速跟进。我的公司曾是Cerebras的风险投资人。Cerebras所做的是完全不同且极其困难的大规模计算方式。这种架构决策带来了特定的权衡,但正是这种困难让他们能做别人做不到的事。我们很快就会知道这到底有多大价值。
你知道,他们正在研究一些非常酷的东西。比如Cerebras面临的一个问题:当你需要将大量芯片连接起来,并构建扩展型(scale-up)或分布式(scale-out)网络时,你需要大量的输入/输出(IO),而IO受限于所谓的“海岸线”(shoreline)——即芯片的边缘。Cerebras的片上计算内存与“海岸线”IO的比例极高。但他们是非常聪明的人,已经做了极其困难的事。他们现在正尝试在芯片顶部直接集成一块光学晶圆(optical wafer),从而解决这个问题。我敢肯定,他们也在研究DRAM的混合键合(hybrid bonding)技术,以绕过那些所谓但并不真实的限制。
理论上,Cerebras机器可以运行任意大小的模型。对于某些特定规模的模型,他们的表现远优于其他方案。我认为Cerebras最有趣的地方在于,他们做了一件既不同又极其困难的事——晶圆级计算(wafer-scale computing)。因此,我认为这些公司确实有其角色。我只是鼓励所有创业者:做出不同的权衡,并尝试做一件困难的事。因为在Cerebras IPO之后,所有人都会获得融资,这不会是问题。但Cerebras花了整整三代芯片才做对这件事,这真的非常困难。你能从CEO安德鲁·费尔德曼(Andrew Feldman)和他的团队身上看出这条路有多艰难。他们需要具备那种坚韧和韧性——第一代芯片失败了?这很正常。你能否卷土重来,做出第二代芯片?
关于这个话题,最后一点:这对GPU的使用寿命将是惊人的利好,甚至可能单枪匹马地拯救私人信贷(private credit)市场。
五、GPU寿命延长是私人信贷市场的意外救星
主持人:能详细说说吗?你所说的“私人信贷”是什么意思?
Gavin Baker:私人信贷目前正因SaaS贷款而承受痛苦。无论这些贷款被减记了多少,它们可能还需要进一步减记——如果上市公司都难以适应,那些负债累累的公司又如何能适应并投资于这种利润率结构截然不同的新业务呢?但私人信贷市场也持有大量GPU相关贷款。他们当初做这些贷款时,预期的期限大概是三到四年。而推理任务的分离意味着,我认为这些GPU的使用寿命将达到10到15年。
AI怀疑论者总说:“这些公司都在粉饰账目。GPU的有效寿命只有一两年,CPU也只有四年,因为技术迭代太快。”但事实并非如此。正是因为预填充和推理的分离,技术快速迭代反而延长了硬件寿命。你现在可以把Cerebras系统或Groq LPUs(英伟达收购的)放在Hopper甚至Ampere GPU前面,用Hopper和Ampere处理预填充任务,从而极大延长这些GPU的使用寿命——直到它们熔化为止。(当然,它们确实会熔化,所以还是有时间限制的,但也许你不必让它们全速运行。)
这对整个私人信贷行业将是极大的利好。它将有助于为AI基础设施建设提供融资,因为如果你能以5%或6%的利率(而非之前Crow的最低7%左右)为GPU融资,这在数学上会显著降低整个建设项目的融资成本。我们正经历一场技术创新,它将降低融资成本,并延长地球上的计算设备使用寿命。
最后一点也很有趣:我的朋友Jamon(来自Coatue)最近做了一期播客,Coatue有个演示文稿提到:“短缺的卖家(sellers of shortage)的表现远好于短缺的买家(buyers of shortage)。”这里的“买家”指的是超大规模云服务商(hyperscalers)。但如果你已经拥有大量当前短缺的设备,那也是一个极佳的位置。我们听到越来越多的声音说,在“智能体”(agentic)世界中,CPU的重要性远超以往——它们负责编排、工具调用等任务。而全球最大的CPU集群恰恰就在这些超大规模云服务商手中。因此,我认为这些超大规模云服务商可能会稍微追赶一下“短缺卖家”的步伐。
主持人:我想谈谈“不同且困难”这一理念在基础设施之外的应用。你现在开始与新一代创始人、以及必须适应这个新世界的现有CEO和创始人互动。你观察到的那些最“原生AI”的创始人——他们不造芯片、不做基础设施、也不训练大模型,只是利用这项技术构建其他东西——他们给你什么感觉?如果你观察到了差异,他们最与众不同的地方是什么?
Gavin Baker:首先,我认为这对芯片设计而言一直是个根本性问题。在风投领域,我一直认为存在两类创意:一类是地球上任何人一听就明白的显而易见的想法;另一类则不然。如果你处于第一类,而且这件事并不难做,那么在你建立起规模优势(scale is the ultimate advantage)之前,全世界都会意识到这一点,你就麻烦了。
亚马逊的伟大之处在于:虽然很多人意识到了电商的机会,但零售业CEO们并没有意识到。亚马逊非常聪明——任何VC投资的电商公司,他们都能轻松摧毁:我们会把利润率压到负10000%。”Wayfair的团队就做了件困难的事,亚马逊试图杀死他们但失败了。他们是那种运营极其强悍、能力超群的CEO。
对我而言,在风投中,我总是会问:在这家公司建立起规模之前,这个创意会不会变得人尽皆知?还是说,这个创意既不显而易见、与众不同,又极其困难?我认为很多创始人都在AI领域苦苦挣扎。
如今,人们越来越担心:在黄仁勋提出的AI五层蛋糕中,利润正流向能源、数据中心、芯片和模型层,而应用层几乎没有分到利润。Cursor和Cognition之所以成功,是因为他们18个月前就专注于编程领域。当时OpenAI还在尝试各种方向,而专注编程的只有Cursor、Cognition和Anthropic。专注于代码确实是明智之举。MSAD(Replit创始人)曾发推说了一句非常聪明的话,大意是:“与‘苦涩教训’相关的一点是,编程可能是通往ASI(人工通用智能)和实用AI的最短路径——因为如果你擅长编程,你就能为自己编写代码去做任何事。”
因此,这些公司专注代码是非常明智的,我认为他们都已达到一定规模,拥有了自己的位置。Cognition正在做一件真正与众不同的事。但我认为很多创始人都在苦苦挣扎——他们试图在细分领域建立信心,希望在模型公司进入该领域之前,先建立起自己的数据护城河(data moat);或者赌这个细分市场足够小,模型公司不会亲自下场,但仍能产生风投级别的回报。
主持人:这是否与你之前提到的“token路径”(token path)有关?
Gavin Baker:是的,这个说法来自Altimiter的Jamon Ball。他说:“无论你是软件公司还是AI公司,你都必须处于token路径上。”Databricks就处于token路径上,同类公司也是如此。如果你不在token路径上,又不做极其细分的事情,日子可能会很难过。
即使对于这些垂直细分领域,如果你和模型公司的人聊一聊,他们会对此表示怀疑——因为这些细分领域产生的数据都来自人类。而你押注的是:你能利用这个狭窄垂直领域的专有数据,训练出一个成本低于前沿实验室的模型。这或许是个不错的赌注,但我认为你必须非常非常谨慎。
另一方面,如果前沿token相对于其他token的回报率下降,应用层将迎来价值创造的大爆发。另一个非常重要的观点是:我相信只要黄仁勋愿意,他很可能用自己的模型非常接近前沿水平。
我认为你会看到,今天的开源前沿主要由使用“窃取的美国token”的中国模型组成。有人告诉我,DeepSeek最新版(或最初版)仅用了15万条推理轨迹(reasoning traces)。中国公司有很多方法“洗白”这些数据:你可以调用各种API,让追踪变得困难。不过,美国实验室正在努力开发反蒸馏(anti-distillation)技术。
但我认为,中国开源社区在资源极度受限的情况下做出了令人印象深刻的成绩,其中包含大量蒸馏(distillation)成分。这也是为什么我认为,除了算力不足以服务Mythos之外,他们根本不想让Mythos被蒸馏——他们想自己用Mythos进行蒸馏,并用它通过强化学习(RL)训练下一代模型。
最终,我认为如果OpenAI或其他前沿公司觉得经济上可行,他们会面临一种全新的博弈论困境——一种新型“囚徒困境”。过去的囚徒困境是“你必须投入资金”,而新的囚徒困境是:“如果你处于前沿,你会通过API发布你的模型吗?”如果所有前沿公司都同意不发布,那么中国开源社区很快就会……但如果有一方背叛,他们将拥有最好的模型、大量收入和现金流,而“资源等于智能”(resources equal intelligence),他们将开始领先,最终迫使所有人都发布模型。这是一种新的博弈论,类似于台积电、三星和英特尔之间的博弈。
现实是,如果英伟达或AMD真的使用其他晶圆厂,那家晶圆厂会迅速变强。因此,我认为黄仁勋会让开源模型始终落后前沿一段时间。这将是非常值得关注的现象。
顺便说一句,开源模型是可以货币化的。“开源免费”是个误解。开源token需要消耗能源,需要用GPU生产,而开源模型公司几乎总能获得收入分成。
主持人:你如何为Mythos 3、Mythos 4的世界布局交易?
Gavin Baker:我们正试图在网络安全领域过度投资。我在多个场合都说过,并且深信不疑:每个人都需要一个“安全词”(safe word)。每个人都需要暂时离开数字设备,真正去海边,和家人或公司设定一个安全词——而且不能是容易被社交工程破解的那种。这是为了防范网络犯罪:比如有人Facetime你,看起来完全就是你的儿子、女儿、祖父母或父母,模拟得毫无破绽。他们知道一切,并能基于过往言论精准推测对方可能说的话,然后说:“给我汇100万美元。”
主持人:这是防御性的。那在分析层面,你还能做什么是它无法做到的?
Gavin Baker:这是个好问题。我刚看了《最后的武士》(The Last Samurai),并让公司同事也去看。如果你没看过,我强烈推荐。这部20年前汤姆·克鲁斯主演的电影历久弥新。剧情讲的是:克鲁斯饰演一位愤世嫉俗、退役的内战老兵(其实是个优秀士兵,但因参与迫害印第安人而心怀愧疚)。他在明治维新时期被日本政府雇佣,训练一支农民军队对抗武士。第一场战斗中,尽管武士没有枪,却依然获胜。克鲁斯英勇作战,武士决定不杀他,带他回村。他逐渐成为武士,并在内战般的冲突中站在武士一方。最终,他却被一个手持机枪的农民射杀。
机枪已经来了。如果我们不能都成为机枪大师,就会被机枪主宰。因此,我正努力成为机枪大师。而且我很乐观:就像一位50岁的资深武士,在许多战争中积累了丰富经验,他使用机枪时也会有优势。作为一名终身学习投资的学生,我相信自己能够掌握这把“机枪”(新技术),将其融入我的个人流程和公司流程,从而在未来很长一段时间内继续作为人类创造价值。
现在,我和所有人一样,时刻运行着各种AI代理。
主持人:你最有用的代理是什么?
Gavin Baker:最有用的代理(老实说,我不想伤害你的生意)是一个能为我精准总结播客要点的代理。每天有大约六小时的内容是我职责范围内必须关注的:每当OpenAI、xAI、谷歌、Cursor、Fireworks、Bain的人发言,更不用说黄仁勋、埃隆·马斯克、Daario等人,我都觉得必须观看,但我实在没那么多时间。这其中有很多“干草堆里的针”。我总是特别关注管理层薪酬:他们被激励去做什么?是愚蠢的RSU(限制性股票单位),还是PSU(绩效股票单位)?如果是PSU,具体激励目标是什么?能在这方面做好初步筛选的系统,能为人们节省大量时间,让他们专注于更具创造性的工作,而不是手动翻阅委托书、对比PSU条款的变化——这其中蕴含信号,但劳动密集度极高,非常适合AI处理。投资领域显然也有无数类似场景。这是成为投资者最激动人心的时刻。
主持人:但我也有些担忧——关于“多样性崩溃”(diversity breakdown)。
Gavin Baker:是的,我越来越担心这一点。比如,我不认识任何一个像我这样对DRAM不看涨的人。一个都没有。
现在AI领域发生了很多有趣的事。首先是横向估值(cross-sectional valuations)完全不合理——它们根本不可能同时成立。半导体设备公司以明年一季度年化收益的40倍交易,而DRAM公司却只有个位数市盈率。上一轮周期高点时,这个比例是5倍对12倍,甚至一度达到3倍对45倍。这种差距不可能持续。诚然,半导体设备公司的商业模式比内存公司更优,但我们还不知道HBM能在多大程度上改善内存公司的商业模式。虽然设备公司通过零部件和服务有部分经常性收入,但这不值得1000%的估值差距。
我认为很难解释:一方面,英伟达在四月初的估值相对于市场处于过去10-12年来的最低水平(绝对估值也很便宜);另一方面,GE Vernova的估值却隐含了英伟达将遭遇难以想象的市场份额流失。这种横向估值的巨大差异,正是因为我们正处于短缺之中。
在短缺中,质量最低的公司表现最好。如果你是油气或自然资源投资者,熟悉成本思维,这对你来说很直观:在真正的商品牛市中,成本最高的供应商涨幅最大——因为他们从破产边缘一跃成为现金牛。这也是大宗商品投资极其困难的原因:高质量公司在周期中跑赢,但绝大部分超额收益出现在下行周期——当那些在短缺和牛市中暴涨的高成本公司破产时。
你现在在每个行业都能看到这种现象:那些被超大规模云服务商和买家厌恶的低质量玩家(因为成本高、不可靠、部件故障率高),现在却供不应求、不断提价。这种活动吸引了X平台上的散户,这些股票被炒上天。而一些高质量标的却显著跑输。作为投资者,这很煎熬——因为你非常确定那只3-6个月内涨了10倍的股票最终会跌回去(除非他们用现金做了明智的事)。但这些低质量公司确实用现金做了些聪明事。
这让我有点担心:一年前非常怀疑的人,现在不再怀疑了。但当我对比这些高质量公司的估值(并未高估)时,我又感觉好些了。不过,这确实让我想起2024-2025年时觉得很滑稽的一点:当时居然有人讨论AI泡沫——因为你眼前明明有一个核聚变泡沫、一个量子泡沫。这才是现实!但如今,这种“核聚变/量子”的狂热可能蔓延到了更投机、质量更低、市值更小的股票上——如果你在X或Reddit上有很大影响力,很容易就能推动它们。这让我有点害怕。我真心希望有更多AI空头,更多内存空头。
比如Astera这只股票,我长期关注,有很多空头,这很好。我最早在C轮融资时就投资了它。别指望能在我面前差异化定价,也别指望它是“铜输家”(copper loser)。此外,你能感受到市场中的“篮子效应”(baskets)和杠杆篮子——你属于哪个篮子非常重要:铜、光通信、DRAM、NAND。
今年发生了一件非常有趣的事:在2024-2025年,AI交易是联动的——比如你可以做多GPU计算、扩展型网络和跨节点光通信,同时做空电力。这种交易从风险管理角度看是合理的(因为我非常关注因子)。但今年1月,这一切都崩解了:扩展型网络疯狂上涨时,分布式网络却在下跌;DRAM大幅跑输NAND和HDD(这在过去从未发生)。AI内部的横向相关性彻底瓦解,你必须极其精细——不能再用半导体设备或NAND来对冲内存风险。今年1月,所有横向关系都发生了非常有趣的变化。我认为原因之一是:AI发展到一定质量后,突然有大量人能深入理解各个子领域并开始交易,然后这些股票被打包进各种“篮子”,从而创造了价格效率。
因此,我认为除了那些能长期复利的高质量标的(它们安全,不像低质量标的那样可怕)之外,最大的机会在于那些被错误分类的股票。比如Astera曾被归入很多“铜输家”篮子,但Astera的最大产品将是交换机——而交换机同时使用铜缆和光缆连接加速器。因此,从定义上讲,交换机公司或加速器公司不可能是“铜输家”,因为你必然处于连接的另一端。
六、谷歌、Meta、微软、亚马逊的AI路径
主持人:我很好奇,你能否用一两句话点评一下各大公司?我总觉得忘了问你:谷歌、微软、亚马逊这些上市公司,所有讨论都围绕这些令人兴奋的新公司展开。
Gavin Baker:好的。谷歌去年非常不可思议,因为他们拥有TPU优势(现在已消失)。我认为他们仍处于有利位置,仅仅因为他们拥有最多的算力。我们讨论过,在短缺环境下,已部署算力的价值更高——而谷歌拥有最大的已部署算力基础。
我对他们感到有点惊讶。本周就是谷歌I/O大会。如果他们不发布哪怕略微超越OpenAI或Claude的产品,虽然不是灾难,但会很有趣——这意味着我们讨论的“英伟达效应”比我想象的更强大。我非常好奇,5天后谷歌发布新产品后,“帕罗前沿”(Paro frontier)会变成什么样。这对他们是张大牌。
但谷歌凭借其数据量(尤其是YouTube数据——在机器人时代极具价值)、算力规模和搜索业务,永远不会处于不利位置。你看GCP的疯狂增长就知道了。
你必须给扎克伯格巨大赞誉。他在内部将Meta转变为“AI优先”公司,我认为他是唯一做到这一点的互联网巨头。我非常认可他为此付出的努力,包括早早签下那些十亿美元级别的天才人才合同。Muse(MSL的第一个模型)对我来说是个巨大的惊喜——虽然它不在帕罗前沿(与xAI、谷歌、OpenAI、Claude相比),但已非常接近,这给我留下深刻印象。因此,我认为Meta处境更好——虽然绝对位置仍不如谷歌,但在市场中,变化率比绝对水平更重要(尤其在三年这样的短期框架内;长期来看,竞争优势的绝对水平才占主导)。即便如此,变化本身确实至关重要。
亚马逊凭借Tranium处于非常强势的位置。未来18个月,你将在其零售业务中看到机器人带来的真实P&L效率提升。我认为他们的内部模型Nova虽不及Muse,但比外界评价的要好。
微软方面,我认为萨提亚(Satya)非常聪明,但在投资者对话中,人们谈论他的方式已大不如前。我喜欢萨提亚,钦佩他,认为他是杰出的CEO,并认可他的决策。但你要知道,他从“我们要让谷歌跳舞”变成了“Copilot的产品经理”,只用了三年。我很好奇:在OpenAI政变期间,萨提亚是否后悔自己的决定?他是否希望当初支持伊利亚(Ilya)而非山姆(Sam)?如果今天由伊利亚和米拉(Meera)执掌OpenAI,微软与OpenAI的合作可能会截然不同。这是个我们永远无法知道答案的有趣问题。
但我必须给他巨大赞誉:他现在所做的决策是有风险的。在不确定性锥体(cone of uncertainty)中,你不仅要决定投入多少,还要决定投入什么。我认为微软在2025年初曾犹豫过——他们有个算法:“投入这么多资本支出,就能获得这么多回报”,但这个算法当时失灵了。一旦犹豫,你就会失去位置——失去所有算力配额,且很难再拿回来。
因此,萨提亚现在做的决策(尽管市场因此惩罚了他,但我认为是正确的)是:我们将使用自己的算力,而不是(谁知道如果他们愿意把GPU卖给OpenAI,Azure的增长会有多快)仅仅服务OpenAI。我们将用算力内部提升自己的产品。Copilot之所以表现糟糕,很大程度上就是因为算力不足。他们正在解决这个问题。萨提亚现在是Copilot的产品经理。我认为他是位伟大的CEO,他们正试图用算力训练自己的模型。我有点怀疑他们是否有合适的团队能成功,但他们和Meta一样,完全可以负担得起组建新团队的费用。我认为他正在做出有风险但正确的决策,为微软在这个“前沿模型不再通过API开放”的世界中定位。如果微软仅仅用GPU服务OpenAI和Anthropic,而不是用于自家产品,今天股价可能已是800美元。因此,我非常认可他做出的这个伟大决策。
真正有趣的是,这些公司在决策上的“对外导向”程度。与初创公司互动最深入的两家公司是亚马逊和英伟达,遥遥领先。其次是谷歌。博通(Broadcom)则以不同方式参与——他们是每个人最喜欢的AS6供应商。对初创公司而言,如果第二代芯片能与博通合作,就算“升级”;如果博通愿意在第一代芯片就合作,简直是“天降甘霖”。而AMD、微软和Meta基本上与初创公司零互动。(我说“零”可能有点夸张,但基本如此。)我很好奇这个决策——因为一些最优秀的团队已不在大型上市公司,而在这些小型初创公司。我认为这最终将成为英伟达、AMD和紧随其后的谷歌的巨大优势,而其他超大规模云服务商则缺乏这种互动。
主持人:在结束前,我很好奇你是否还思考过这个巨大趋势的其他连锁反应?我们详细讨论了受影响最直接的公司,也谈了些应用层的情况(以及应用层要创造更多价值需要什么条件)。我还想知道,随着这个世界如此快速地变化,你是否还想到其他有趣的连锁效应?
Gavin Baker:是的,这确实很疯狂。在应用层,别说价值聚集了,价值实际上已被摧毁——即使算上最成功的AI原生公司Cursor和Cognition,AI在应用层已摧毁了数万亿美元的价值。
在此背景下,我认为有一点需要警惕:今天表现最好、价值增长最多、创造经济价值最多的公司,是那些“人均GPU利用率”(utilized GPUs per human)比率最高的公司。也许这意味着每个人未来都会拥有大量GPU,但这是一个我们需要意识到的有趣事实。
我还要说一点(可能有点阴暗):我越来越担心人身安全——尤其为那些公众形象更大、与AI关联更深的人担心。我希望不要发生悲剧,但美国的政治暴力正在抬头,而AI日益政治化,我担心这种暴力会越来越多地针对AI领域的政治领袖。无论我对OpenAI有何看法,我认为有人向山姆·阿尔特曼(Sam Altman)家投掷燃烧瓶是极其可怕的。
我担心我们正进入一个更高波动性、更高贝塔、更高风险的世界,而这都是因为AI。对我个人而言是如此,对棋盘上的大玩家更是如此。从地缘政治角度看:我们看到乌克兰人开始真正取胜。我认为他们取胜的原因并非仅仅是拥有更好的无人机(虽然这也是部分原因),而是因为他们拥有仅次于美国和以色列的最佳战场AI。当中国等对手开始意识到这一点时,他们会如何回应?美国因AI优势而受益固然是好事,但这对世界其他地区却是破坏稳定的。
我非常乐观地认为,AI将为世界带来奇迹。比如,有位女儿被诊断出罕见基因突变(无药可治)的父亲,通过AI整合资源、获得实验室算力、启动大量代理,最终找到了一种能影响女儿病情的上市药物,并创办公司研发治愈方案。她的人生已因AI而彻底改变。
因此,我是个极端的AI乐观主义者。但我也承认,AI就像一个“事件视界”(event horizon)——它必将带来不连续性。作为社会,我们需要谨慎导航。精英们可能会判断错误,但我们必须认真对待他们的担忧,确保AI惠及所有人。现在最好的AI只对富人开放,这有点反乌托邦。我们需要解决这个问题,以谦卑的态度面对不确定性,并深思熟虑。
主持人:每次和你做完节目,我都会告诉别人:“愿你找到一份热爱,如同加文(Gavin)热爱市场、公司、资本主义和历史一样——今天再次展现无遗。” 非常感谢你的时间。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
- VictoryYBh·05-23一手信息来自行业前沿人士1举报
- JerryDelta·05-26太棒了~点赞举报
- 财运连连牛叉·05-25[财迷]点赞举报

