Anthropic首席财务官万字访谈实录:千亿美元算力内幕
按:我们在4月时曾发文提到(关于投资AI产业链的一个分析框架):大规模云服务商的资本支出规模增长本质取决于更上游的AI实验室的算力预算,并由此推断这些企业在一季报的资本支出大概率会继续超出市场预期。该推论已被现实验证。往后看,市场最关心的问题是:AI实验室还有可能继续增加算力预算吗?
5月13日,Anthropic 首席财务官 Krishna Rao 接受知名播客《Invest Like The Best》的专访。在对话中,他深入探讨了多项关键议题,包括 Anthropic与xAI超大规模算力集群达成的合作;公司与谷歌、博通及亚马逊签署的百亿美元级算力供应协议;以及 Anthropic 内部如何高效分配和调度异构计算资源。
Rao 强调,模型智能不应被简化为单一维度的“智力分数”,而应理解为一套解决现实世界复杂任务的综合能力体系。当前,前沿 AI 模型在企业端已展现出极为可观的经济回报——每一次新一代模型的发布,都在不断解锁此前无法触及的应用场景,从而推动公司收入实现指数级增长。
他特别指出,Anthropic 的巨额融资并非用于填补现有亏损,而是为了前瞻性地应对所谓的“不确定性锥形区域”(cone of uncertainty):即在极早期就锁定未来数年所需的庞大算力资源,以支撑业务的指数级扩张。
此外,Rao 批判了资本市场普遍将算力视为“特定时段内可变成本”的传统视角。在他看来,Anthropic 将算力视为一种高度灵活、可动态调度的战略资产——例如,同一组 GPU 集群可在白天用于客户推理服务,夜间则切换至模型训练或研发任务。这种在传统软件公司或制造业中几乎不存在的资源复用性与调度弹性,正是驱动短期收入与长期技术领先相互强化的核心机制。
简言之,从 AI 实验室的视角看,当前整个 AI 产业链仍处于需求远大于供给的状态。尤其当模型进入“递归式自我改进”阶段后,其能力的指数级跃升会触发类似“杰文斯悖论”的效应——效率提升反而引发更庞大的算力需求。这对财务规划构成巨大挑战:
买多了算力,公司可能因过度投入而倒闭;买少了,则既无法服务客户,也无法维持技术前沿地位——两种选择都可能导致失败。
以下为正文,全文两万字,预计阅读时间1小时,供感兴趣的朋友参考:
主持人(Patrick O'Shaughnessy):我一直非常期待这次对话,因为你能从内部视角观察历史上最有趣的企业之一,而且可能正处于世界历史上对技术从业者或关心技术的人来说最有趣的时刻。我特别感兴趣的一点,就是你每天都要面对的算力问题。这是你工作的核心部分,也是这些公司正在做的事情的关键所在。我很想请你先解释一下,处理这个问题究竟是什么感觉?我听说你们曾经每天开会讨论如何分配算力、分配给谁以及为什么分配。我认为这正是当前最前沿的焦点所在。
Krishna Rao:我们采购的算力是我们业务的生命线,是公司最重要的东西,是一切得以构建的画布。因此,我们在购买多少算力方面所做的决策,是整个公司最具影响力也最艰难的决策之一。你可以这样想:如果你购买了过多的算力,公司就会倒闭;如果你购买得太少,就无法服务客户,也无法保持在技术前沿——结果是一样的。所以我们经常谈论“不确定性锥”(cone of uncertainty)这个概念,但这些采购决策具有真实的现实影响。你不可能今天决定购买一千兆瓦的算力,下周就交付到位。你必须提前规划。因此,我们采取非常严谨的方法来思考这个问题:我们自下而上地建模预测需求(尽管有时会出错),估算维持前沿地位所需的算力,并前瞻性地进行预估。当我们实际签署算力采购协议时,灵活性对我们至关重要——我们不仅在协议中嵌入灵活性,也在算力使用方式上构建灵活性。因为在业务呈指数级增长的情况下,从当前状态迈向目标状态的关键,就是尽可能高效地利用算力。即使到今天,我仍有30%到40%的时间花在算力问题上。
主持人:在这个例子中,“灵活性”具体指什么?
Krishna Rao:它包含几个层面。首先,我们使用三种不同的芯片平台:亚马逊的Tranium芯片、谷歌的TPU和英伟达的GPU。我们将这些芯片视为可互换使用的资源。我们购买的算力主要用于模型开发、内部加速自有产品和模型开发,以及为客户提供服务。在这三个芯片平台上,我们都将算力用于上述内部和外部用途。实现这种灵活性花了我们很长时间——多年来我们持续投入,如今我相信我们已成为前沿实验室中最高效的算力使用者之一,这不是一夜之间就能做到的。当初我们开始使用TPU时(大约是从第三代TPU开始大规模使用),很多人觉得我们疯了:“大家都在用GPU,你们为什么不用?”但我们投入巨资,实现了极其灵活的算力使用能力。此外,我们还会跨不同代际的芯片平台进行优化,将每一代芯片用于最适合的内部工作负载。为此,我们构建了一个编排层(orchestration layer),使我们能够灵活使用各种类型的算力,并从中获得最大价值。
主持人:我这样理解是否正确:像CUDA这样的技术长期以来一直是英伟达故事的一部分,它允许你充分利用底层硬件,尽可能接近裸机性能,从而实现这种灵活性并控制尽可能多的变量。这是你们走过的道路吗?
Krishna Rao:这确实是旅程的一部分,但过程也非常注重协作。我们与亚马逊的Anaperna Labs团队密切合作,帮助影响这些芯片的发展路线图,因为我们相信我们正在做的事情极大地挑战着这些芯片的能力极限。这意味着我们组织内每一美元的算力都能产生比其他地方更远的效果。更重要的是,我们希望在公司内部为每种芯片找到最佳用途——为此我们甚至开发了自己的编译器,从芯片层级向上构建定制化工具,以实现内部使用时的最大投资回报率(ROI)。
主持人:你能解释一下“不确定性锥”这个概念吗?这似乎是一个关键起点或整体框架,用于思考算力的采购和使用。
Krishna Rao:当你以指数级速度构建和扩展业务时,月度或周度增长率的微小变动会导致截然不同的复合结果。因此,在前瞻性思考时,即使我们的收入增长也是如此难以预测。人类通常以线性方式思考,倾向于增量式思维。我在公司两年了,这是我必须为自己打破的一种思维范式——停止线性思考,转向指数级思维。当你处于指数级增长轨道上时,结果的范围会变得非常非常宽泛。我们会审视一系列情景,并在1-2年的时间范围内考察“不确定性锥”中的不同节点,然后反向推导。
我们希望达到的状态是:既能保持在技术前沿(这是最重要的),又能服务好客户,同时拥有足够的内部算力来加速员工效率。有趣的是,如果我们告诉员工不能再使用我们的模型,那么原本分配给员工内部使用的算力本可以支持数十亿美元的收入。但我们希望从长远角度看待“不确定性锥”,朝着这些结果的上限区间努力。而要做到这一点,就必须提前规划。这就是我们以严谨方式购买算力的思路。最关键的问题是:如果你处于“不确定性锥”的某个位置,却只按另一个位置采购了算力,这时算力效率就显得尤为重要——它确实帮了我们大忙。
主持人:能否带我们进入那些关于权衡取舍的会议现场?我对这三大类用途特别感兴趣:训练/研究、内部使用(广义上)和服务客户需求。直观来看,你可能会认为分配比例是各占三分之一左右,但实际上这个比例是如何变化的?有哪些权衡?这些讨论日常是如何进行的?
Krishna Rao:除了算力采购会议外,我们还经常召开算力分配会议。重要的是,我们的文化极具协作性,这决定了讨论的方式——不是零和博弈,而是高度协作的。不过,我们为模型开发设定了一条不可逾越的算力底线:即使这意味着服务客户变得更困难,或需要采取一些非自然的措施,我们也要继续对开发最佳模型进行长期投资,因为我们相信前沿智能的回报极高,尤其在企业领域。这为模型开发的算力分配设定了底线。
在考虑内部算力使用时,它确实帮助我们加速模型开发,并更快找到那些能让我们从每美元算力中获得更多产出的“算力效率倍增器”。讨论时,每个团队都会陈述他们将如何使用算力,然后我们就投资回报率(ROI)展开坦诚开放的讨论。由于我们可以动态分配算力,因此能在相对较短的时间内做出调整。
主持人:算力效率这一点让我非常感兴趣。你是否能大致评估一下,与一年前的内部基准相比,或者与其他你有所了解的机构相比,你们现在的效率提高了多少?你们如何衡量“效率”?
Krishna Rao:我会从几个角度思考这个问题。从模型角度看,人们常把新模型比作汽车:之前你有一辆轿车,现在可能升级到更高配版本,沿着这条链不断向上。在模型智能方面,这种类比确实成立。但这个类比也有局限:人们会想,“我从轿车升级到跑车,燃油效率肯定会大幅下降吧?没人买跑车是为了省油。”但在我们这里,情况恰恰相反——我们既看到能力的巨大提升,也看到模型效率的显著提高。以从Opus 4到4.5、4.6再到现在的4.7为例,每次跃迁(虽然幅度不等)都带来了处理token效率的倍增。这不仅惠及客户,也帮助我们内部提升效率。
例如,当我们对模型进行强化学习(RL)时,本质上是在带有奖励函数的沙盒中进行推理。如果模型的推理效率更高,那么强化学习的效率也会随之提高。因此,我们实现了双赢:客户在新模型发布时获得更强的能力,而我们提供该模型的效率可能比上一代高出数倍。在代际之间,我们还会动态部署效率改进措施,而非等待阶梯式的模型更新。因此,效率始终在不断提升,而驱动这一切的正是研究团队。所有这些环节紧密相连:内部的各种任务和工作负载共同构成了一个整体,涵盖模型能力研发、算力效率提升、客户服务,以及通过使用最佳模型(有时甚至是尚未发布的模型)加速内部工作负载。
主持人:你之前提到一个非常重要的观点:“处于前沿的回报非常高”。能否详细解释一下?听起来显而易见,但确实存在一些观点认为:“我可以使用六个月前的旧模型,成本只是零头,而且它会不断追赶最新水平。”但事实并非如此。每当Opus 4.7或GPT-5.5发布时,作为消费者,我们立刻就会切换到新版本——因为我们都想要最好的。请谈谈为什么处于前沿的回报如此之高。
Krishna Rao:我认为有几个原因。每次推出新模型时,都会带来一组不同的能力。人们倾向于将模型智能视为单一数值的IQ(比如从110提升到125),但我们认为智能是多维度的,不仅仅是一个分数。事实上,尽管各家都会发布模型基准测试卡,但我们发现很多基准已经饱和(我们自己也发布)。我们真正关注的是客户反馈:这个模型在现实世界中的实际能力如何?
随着我们发布越来越好的模型,我们发现不仅仅是绝对智能的提升,还包括执行长周期任务的能力、使用工具或计算机的能力,以及更快完成具有特定价值的智能体任务的能力。这意味着:如果有两名能力相当的员工,一人完成任务需一周,另一人只需一天,那么后者若持续如此,效率就是前者的七倍——他们能力相当,只是耗时不同。所有这些因素共同影响客户的体验。
我们非常一致地发现:通过发布新模型,可解锁独特的TAM(可寻址市场)。更多TAM被释放,更多用例成为可能。过去四个月就是很好的例证:年初我们年化收入约90亿美元,季度末已超过300亿美元。这种变化正是由模型智能的飞跃及围绕它们构建的产品所推动的。这就是我说“前沿智能回报极高”的含义。我认为这在企业领域尤为独特——消费者可能不会像企业客户那样迅速触及模型能力的极限。我们的企业客户最初从编码开始,现已大幅扩展到其他领域。每一代新模型都让我们有机会做得更多、更好、更高效,客户看到了这一点,因此在新模型上投入大量token。我们反复见证了这一循环,这也是我们业务的核心理念:尤其在企业领域,前沿智能的回报并未放缓。
主持人:你们正在推动的前沿(以及OpenAI推动的前沿)似乎如同科幻小说中的情节——各大实验室似乎已达到某个临界点,正如你团队某位成员最近所说,进入了“递归式自我改进”阶段:模型本身正在构建并完成下一代改进的大部分研究工作。如果将你们率先达到这种递归状态的情况与开源模型对比,差距可能会因此进一步拉大。你如何看待这一点?率先达到这一点似乎至关重要,因为此后你们就能持续拉开与尚未达到此阶段者的差距。
Krishna Rao:我认为我们确实看到进展在加速。我不便评论其他公司,但对我们而言,缩放定律(scaling laws)依然有效且强劲。以最近公司内部的Mythos为例,90%以上的代码实际上由Cloud Code编写,而大量Cloud Code又是由Cloud Code自身编写的。这解释了为何我们要在内部分配算力——宁愿放弃部分收入,也要让模型帮助我们构建下一代模型。
除了缩放定律带来的能力飞跃外,人才也至关重要。拥有最佳模型的人才能真正加速能力开发,我们正切实看到这一点。我们并不将模型视为“开源”或“闭源”,而是“前沿”或“非前沿”。处于前沿的模型显然正在捕获经济价值,为客户创造有意义的ROI。我们正全力投资这一理念——这不仅意味着算力投入,也意味着投入人才来使用这些算力和自有模型,真正加速开发进程。
另一关键点是:不仅仅是模型本身,更是构建于其上的产品。仅在今年1月,我们就发布了30项不同的产品和功能,且这一速度还在加快。部分原因在于,我们利用自有模型和人才,加速了访问底层智能的方式。这是我们产品端的核心理念。
主持人:你提到人才和杠杆作用——他们不再亲自编写代码,而是由Cloud Code编写自己的代码。这似乎暗示最终一步可能是:甚至不需要人才告诉系统该做什么,系统自己就能弄清楚该做什么。这似乎是终极状态——系统只需受算力等因素约束即可自主运行。我这样想是否过于疯狂?还是说这种未来确实可能实现?
Krishna Rao:我认为我们公司的核心仍是一家研究实验室(这点可能外界不太了解,但现在逐渐被认知)。我们正在进行实验,不断挑战模型能力的极限。这种研究和引擎位于我们所讨论的一切事物的上游。目前,模型虽已赋能这一过程,但尚未完全由模型完成。随着时间推移,我们认为模型会变得更好,在这一过程中提供更大帮助。但拥有最佳人才来设定方向(不仅是优先级,还包括新的探索领域)实际上能让这些研究人才变得更优秀。因此,我认为这是在强化和加速我们已有的人才。
我们常说“人才密度胜过人才数量”,这一点在此同样适用。我们希望聚集最密集的AI研究人才和推理工程人才,结合最佳模型,形成真正的制胜组合。
主持人:目前普遍共识是,缩放定律包含不同组成部分:预训练、后训练、推理等,这些部分以不同速度推进。只有当所有部分同时停滞时,才会遇到真正的瓶颈。这是当前对缩放定律的概念化方式。你们内部如何讨论?你如何看待?
Krishna Rao:我们会在模型开发的不同阶段进行观察。例如,在预训练运行期间,我们会将新模型与之前模型在损失曲线上的表现进行比较,以此评估模型能力。在强化学习(RL)阶段也可进行类似评估。但或许更重要的是客户实际使用后的反馈:他们看到了什么?在哪里发现了痛点?这些痛点随后会成为我们的训练目标(注:我们不在企业端使用客户数据进行训练;在消费者端仅在用户选择加入时使用)。客户会告诉我们:“我希望模型在这方面更强”或“在这个特定场景卡住了,如果能力再强一些,我就能构建其他产品”。我们通常会回应:“那就为那个场景构建你的产品吧,因为我们在研发端会持续改进。”
因此,这是一个紧密连接的循环。内部我们会持续评估不同训练阶段的模型快照,进行内部比较(较少进行外部比较),最终结合客户视角进行综合判断。
主持人:感觉缩放定律本身完全没有放缓迹象。这种描述是否公平?
Krishna Rao:对我们而言,这种描述是公平的。显然,我们的一些创始人正是缩放定律论文的作者,但即便抛开这点,我们对自己要求极高,秉持研究实验室的科学方法,不断挑战既有假设。但从我们观察到的情况看,缩放定律并未放缓。
主持人:如果这是真的,如果这种情况在未来多次迭代中持续成立,你如何在工作中避免线性思维,转向指数级思维?因为其影响实在难以理性推演。指数级增长率是一回事,但能力的指数级增长——我甚至不知道该如何理解。
Krishna Rao:我们以情景规划的方式思考世界。在这个业务中,很难给出确切的点估计。同时,我们对更新当前先验或观点设定了极低的门槛——因为一个月前成立的情况今天可能已不再成立,这会打破你的模型。因此,那种“每季度预测一次,三个月后董事会再重新审视”的做法对我们行不通。业务动态性太强,我们必须时刻思考:“我们的模型以前做不到这点,现在可以了,这对TAM意味着什么?”
我们最初在编码领域看到了这一点:从Sonnet 3.5/3.6开始,能力出现显著跃升,随后带来采用率、使用量和收入的增长。当时很难预测,但现在我们可以将编码作为类比,来预测经济和其他业务领域的未来发展。我们通过识别自身业务中的模式来预测未来。
主持人:就在你到达前15分钟,有关你们与xAI在田纳西州设施合作的新闻发布了。这让我好奇:你们如何在全球范围内寻找这类机会?我确信你们探索过无数可能性。在创造性获取更多算力方面,你们的战略是什么?能否多分享一些这方面的细节?
Krishna Rao:我们宣布了与SpaceX在孟菲斯Colossus设施的合作,对此非常兴奋,这将帮助我们继续扩展(尤其是消费者和专业用户端)。但这只是我们寻找短期算力的一个例子。随着算力基数增长,短期算力在可用总量中的占比会越来越小。我们评估的是:能否高效部署这些可用算力?有时答案是肯定的,有时则否。如果可以,我们会基于价格、使用期限、地理位置、算力类型和运行效率等因素评估其经济回报。我们有一套评估流程(同样用于长期协议评估)。
上个月,我们与谷歌和博通签署了从2027年开始的5吉瓦TPU协议,还与亚马逊签署了最高5吉瓦的Tranium协议,承诺金额超千亿美元。其中大量算力已开始交付,并将在今年剩余时间和明年陆续到位。因此,这就像一个多层蛋糕,不同时间启动、具备不同能力的算力叠加在一起。我们动态比较这些算力,重点关注其落地时的价格性能比,以及我们能在业务内部用它做什么。围绕算力类型、成本和时间跨度,我们需要优化太多变量。但我们有相当动态的方法来评估短期和中长期算力,评估要素基本相同,只是时间跨度不同。
主持人:关于权衡:你提到价格性能比。在算力评估中,如何权衡单位token成本或吞吐量与速度?从客户角度看,他们关心两者。速度可能解锁一些我们尚未知晓的有趣能力和用例。能否谈谈你在算力评估中如何看待这种权衡?
Krishna Rao:在三个不同芯片平台上,我们还有多代芯片(如TPU V5e/V6/V7、Tranium 2/3),它们在价格性能曲线上处于不同位置。更重要的是,我们关注如何利用它们——价格性能比关乎效率,速度对某些用例也很重要。我们会非常细致地评估每种算力能为我们提供什么、何时提供。我们的算力团队主导这一工作,但会与全公司紧密协作,明确“我们需要这种算力做什么”——例如,强化学习可能需要CPU,而领先算力则用于部署最佳最快模型或进行训练。从我们的角度看,这既关乎客户需求,也关乎每种芯片最适合什么任务,以及我们何时能获得它。
主持人:我一直很好奇Anthropic这类公司对新算力的“代谢”速度:如果明天空投给你两倍现有算力,你多久能消耗完?如果是十倍呢?能否给我们一个大致概念?需求似乎在这三大用途(训练、内部、客户服务)之间无限,所有人都这么说,处处短缺,内存股飙升。是否真的极端到:如果明天算力翻倍、五倍或十倍,你们几乎能立即消耗掉?
Krishna Rao:这又回到我们如何使用算力及其可互换性。答案是:目前我们在这些用途间都受到限制。一两年前,面对异构算力空投,我们可能难以快速消耗(因为不同芯片平台差异大,有些更难操作,使用上有特殊性)。但今天,如果我们获得更多算力,我认为能非常迅速地部署到不同用途中。我们可能会保持与当前类似的分配比例,但启动和部署几乎任何类型算力的能力已大大增强——我们认为这是真正的优势。
主持人:回到客户使用Anthropic的方式。一个有趣的张力和权衡是:一种是平台模式(我在Claude基础上构建业务),另一种是你们直接做我想构建的事情(类似Figma与竞品的设计之争)。你们如何思考应深入应用层到什么程度,还是仅作为纯赋能层(提供推理引擎和智能,让用户自由构建,通过API付费)?这似乎是内部有趣且一定程度上存在张力的讨论。
Krishna Rao:我认为我们构建的大部分是平台。我们认为平台能积累大量价值,但基于平台构建的客户能积累更多价值——这正是我们今天所布局的。这类似于AWS早期:云平台及其内置的工具和服务(不仅是原始模型访问,还包括提示缓存、虚拟机使用、Cloud Code调用、Dispatch、Cloud Agents SDK、托管智能体等)都是让其他公司将其模型智能集成到自有产品的载体。这是我们主要专注的方向,也是我们认为业务未来所在。
话虽如此,我们也会在相同平台上构建自有应用,前提是满足两个条件:一是我们对模型发展方向有清晰愿景,能展示并创造客户价值(如Cloud Code——当时市场多为开发者主导,而Cloud Code是Claude主导的平台。虽然一年前推出时模型尚不能完全胜任,但我们相信它们会进步,现在确实做到了);二是通过构建应用为生态系统展示价值,供他人效仿(如金融、生命科学或安全领域的Cloud解决方案)。我们与客户使用相同平台,创造公平竞争环境,同时相信这些领域能创造巨大价值——客户能赢,我们也能赢。因此,我们以合作合伙方式推出这些产品(无论在安全、设计还是金融服务领域)。我们的战略主要是横向的,只在认为能增加价值、提供有用视角或向市场展示平台价值时才纵向深入。大部分价值将由基于我们平台构建的客户捕获。我们的目标是构建最佳模型,并打造产品、工具和服务,让这种智能在客户内部普及。
主持人:有多少在意这样一个现实:人们害怕你们,因为你们控制着这些新应用最核心的部分——底层智能推理引擎。可能确实如此(甚至已经是事实),更多价值出现在Anthropic平台之上而非被其捕获。但即便如此,想象这一点仍然令人不安。或许云计算和AWS也有类似情况。但你们在多大程度上考虑并关心现有或潜在客户将你们视为竞争对手的恐惧?
Krishna Rao:这个行业困难之处在于变化太快,模型能力有时连我们自己都感到惊讶。因此,过去5-10-20年才发生的变革,现在几个月内就发生了。当我们发布模型或产品时,人们也会以类似方式感到惊讶。但从根本上说,我们试图对生态系统采取高度合作的态度:我们有早期访问计划,与客户紧密合作,倾听他们所需的能力。这并不意味着我们发布的东西不会让人惊叹:“哇,这比我想象的强大得多!”或“没想到模型这么快就能做到这点!”——这是当前智能发展周期的现实。但我们的目标是让这些能力真正易于访问,为客户创造大量价值。对于积极采用并使用我们平台工具的客户,我们认为能真正加速他们的发展。部分原因是前沿模型开发的现实,但我们的方法可能更注重合作。
主持人:你之前提到第一季度收入从90亿增至300亿美元,速度惊人。这让我想到定价问题:如何为token或系统使用定价的动态非常有趣。一年前很多人认为价格会持续下降,但实际上许多情况下价格在上涨(无论是Mythos的高定价,还是H100租金呈现微笑曲线)。既然大家都受算力限制,为何不大幅提价以找到均衡点?能否谈谈你们对定价的思考、权衡以及为何不大幅提价?
Krishna Rao:公司成立仅五年多,去年三月才迎来第一笔收入三周年纪念,而我们直到2024年3月才首次拥有真正的前沿模型。这一时间尺度很重要。我们的Haiku、Sonnet和Opus定价一直相对稳定,Mythos较新但我们也极少调整价格。最大的一次调整是在发布Opus 4.5时降低了Opus系列价格。原因在于我们发现Opus级模型的能力未被充分利用——人们常试图将Opus级问题塞进Sonnet工作负载。由于效率提升,我们能高效提供服务,同时降低价格使客户更易获得。这又回到一点:我们希望客户从中创造大量价值(他们已从我们的模型中获得巨额ROI),并希望这种趋势持续下去。我们的目标是在生态系统中普及这种智能,而这些用例仍处极早期。最佳方式是让从初创公司、数字原生企业到全球最大公司的各类企业都能获得这种智能。这意味着定价必须亲民,让他们能从中获得大量价值。
降低Opus价格实际上体现了杰文斯悖论(Jevons Paradox):我们降价后,消费量增长远超预期。因为我们击中了客户的甜蜜点,他们能更广泛使用;我们有足够效率大规模服务客户;他们能将其集成到工作负载中,这样发布Opus 4.6(模型改进版)时,无需改变价格即可直接替换。因此,我们认为价格稳定性很重要,而通过定价实现杰文斯悖论效应也非常关键。
主持人:这个问题的另一个方面是利润率,以及你作为一家企业如何看待利润率,因为建立这些前沿实验室的资本投入是难以置信的巨大。你之前提到的杠杆,即效率和价格,这两者都与利润率相关。如果我的看法很天真,请原谅,但考虑到你们需要如此多的资本,为什么不直接说“我们想要一个健康的利润率”,然后相应地设定价格,也许如果效率提高,价格可以再降下来?所以我很好奇,你是如何看待利润率与业务定价的关系的。
Krishna Rao:我们衡量的是广义算力支出的回报。这涵盖了我们讨论过的所有工作负载,包括客户服务和模型开发。这些活动在不同的时间维度上支撑着收入,推理服务支撑的是当前收入,而模型开发可能是在为六个月后解锁潜在市场并驱动收入做准备。无论是内部加速还是发布新产品,所有这些投入最终都是为了驱动收入。目前,我们算力支出的回报非常稳健。我们关注的是整个算力资源包的整体回报率,从这个角度看,公司目前的处境非常好。我们正在平衡为客户创造价值与确保公司自身获得强劲算力回报这两者之间的关系。
关于收入增长,正如我们在第一季度提到的,那段时间我们并没有增加大量新算力。算力的增长是基于12个月前就确定的爬坡计划。因此,那种认为服务客户的增量成本属于可变成本的观点并不符合我们的业务模式。这种观点试图将我们的业务强行套入软件行业的范式,但事实并非如此。实际上,算力支撑着所有科研与业务活动,我们能从算力投入中获得丰厚回报,这就是我们的衡量标准。我们拥有的算力规模决定了我们在短期和长期内驱动收入增长的能力。
主持人:那么,如果你是这些算力提供商的重要客户,他们需要做些什么才能成为优秀的供应商,帮助你实现更高的回报?
Krishna Rao:我们很幸运,我们在亚马逊、谷歌、微软,以及博通和英伟达都有非常好的合作伙伴。我们的生态系统,你知道,我们是今天唯一一家在三大云平台上都部署了模型的公司。我们是唯一一家使用这三种芯片平台的实验室。而且,这些合作远不止采购那么简单。我认为这一点常常被忽视。如果你想到我们与亚马逊的关系,我们的团队与Anaperna Labs团队深度融合。我们是Tranium的优秀用户。我们花了很多时间和精力与团队紧密合作,并在内部共同规划容量,对吧?如果你想到这三大云平台,它们也是我们绝佳的分发引擎。我们也有一个非常强大的第一方业务。但这些都是多方面的合作伙伴关系,无论是在芯片本身的开发、容量落地、服务提供,还是最终向客户分发方面。
主持人:我在想你的职能,比如财务团队,以及你可能会如何处理这种在不同时间范围内、涉及所有这些复杂变量的算力投资回报率(ROI)问题。这让我想知道,你们自己是如何在内部使用这些强大的工具来管理你的团队和公司的?比如,Cloud Code和Cloud在Anthropic的财务团队中是如何部署的?
Krishna Rao:这真的很有趣,因为大约一年前我们就开始使用Cloud Code了。我当时问大家:“是不是每个人都在‘凭感觉’写代码(vibe coding)?” 我们开始将Claude Code几乎当作一个助手,一个数字同事,而不仅仅用于编码任务。这实际上早于后来演变成Co-Work的产品,那是Cloud Code的一种延伸,理念是:既然它能为智能体软件开发做到这一点,就应该能为所有知识工作做到这一点。然后我们开始将其产品化,我对此感到非常自豪。我们也花了很多时间和产品团队在一起,他们能看到我们是如何使用它的,并从中获得反馈。
但今天,你知道,我们所有的法律实体都可以使用Claude生成法定财务报表。当然,会有人工复核,但所有这些财务报表都是由Claude生成的。我们还有一个更实时的平台叫Ant Stats。过去要花很多时间筛选所有数据、得出结论、撰写备忘录或发布一份关于当天情况及驱动因素的定期报告。我们现在为Claude建立了一个专门针对财务的技能库。我记得上次查看时,已经有70多个技能,每个人都可以通过一个公共仓库访问。
在此基础上,我们还构建了一个月度财务审查(MFR)技能,它可以生成我们的月度财务审查报告。这份报告90%到95%已经完成,然后我们所有的讨论都集中在“我们应该做什么”以及“这意味着什么”上,而不是“到底发生了什么”,因为Claude不仅是在报告天气,还在帮助思考驱动因素,比如为什么数字会以这种方式变化,这让你对业务有了巨大的洞察力,无论是在我们做的这种MFR上,还是在日常基础上。过去需要数小时才能生成一份关于收入或算力利用率驱动因素的周报,现在只需30分钟,然后我们就可以把时间花在业务的实际战略影响上。我们也可以更快地将这些洞察交到业务领导者手中。因此,公司内部的洞察引擎速度大大加快了。
我们内部也有,比如我有一个仪表盘,可以查看跨部门的token使用情况。
主持人:排行榜?
Krishna Rao:是的,我们不会根据这个来给员工发奖金,也没有人为了刷token而刻意使用。但这真的很有趣,因为财务团队中一些资历最深的人实际上是token的最大用户。这不仅仅是那个22岁、有编码背景、周末就在玩、带到工作中来的年轻人。也有很多人在用这些工具来改变他们的工作方式。比如,我认为我们使用量排名第一的用户是我们的税务主管,他非常专注于税务政策引擎,并自动化团队内大部分的工作负载。我很喜欢看到这一点。我也告诉人们,如果我们自己都不是超级用户,如果我们自己都不去突破极限,你怎么能指望客户这样做呢?
主持人:作为一个普通人,所有这些我听到的类似例子,会不会让你有点毛骨悚然?比如在销售或日程安排的例子中,感觉我们开始做AI告诉我们要做的事情了。也许这很棒,也许它确实是一个比我们任何人都更出色的协调者、思考者和优化者,我们应该听从它的建议。但这对我来说感觉有点反乌托邦,而这种现实正在迅速到来。我自己也遇到过这样的例子。感觉很酷,很有帮助,但同时,如果我闭上眼睛仔细想想,“哦,我只是在按它说的做,而不是我在告诉它该做什么”。这是一种非常有趣的人机互动,我很想听听你的看法。
Krishna Rao:我可能对此有稍微不同的看法。我认为,这使得我们能够招聘到公司里的优秀人才,但它让那些本就极具才华的人变得更加高效。这里有一点,我再次想到杰文斯悖论,但这次是针对劳动力的。我们的人变得难以置信地高效,实际上,正因为如此,我们雇佣了更多的人,因为要做的事情永远做不完。现在有了Claude的协助,人们花在MFR上核对数字的时间减少了,而是在思考:“我们如何将这些资源重新投入到业务中?我们如何动态地分配资源?” 而在过去,我可能在忙着核对一个数字,或者在那个会计例子里,花很长时间关账。所以我实际上更乐观地认为,这是一种对我们生产力的加速器,这意味着我们可以完成更多的工作。即使我们扩大团队,这些新成员在熟悉如何在公司内部使用Cloud后,也会变得更加高效。我认为这在许多公司中也开始成为现实。
主持人:我很想谈谈投资者和资本形成。当然,你们不得不筹集大量的资本。但同时,如果我眯起眼睛,想想基于当前收入的估值倍数,你们融资的估值似乎也并非那么疯狂。我非常好奇,你能跟我们分享一下与投资者打交道的经历吗?你如何看待他们对公司理解的演变和成熟?你认为投资者作为一个群体,现在对Anthropic的理解是什么?他们对Anthropic有哪些误解?
Krishna Rao:我大约两年前加入公司。当时我们正在结束D轮融资。那并不是一次简单的融资。公司在那次融资中途才真正拥有一个前沿模型。在融资接近尾声时,FTX事件导致大量Anthropic股份被清算,这就是当时的起点。那时的问题主要围绕:为什么你们需要一个前沿模型?这有什么回报?此外,还有关于我们使命以及行事方式的问题。人们会说:“嘿,AI安全和打造一个巨大的商业帝国,这两者难道不是相互矛盾的吗?” 还有很多其他的误解,比如“你们的销售团队规模很小,难道不需要像其他企业软件公司那样扩大规模吗?” 所以,当时人们试图把我们强行塞进一个之前就存在的特定模式里。
随着时间的推移,情况发生了演变。在2024年底,我们完成了E轮融资。当时公司的年化运行收入已接近10亿美元。但我们首次交割的那天,正好是DeepSeek新闻发布的时候。
显然我们完成了交割,但市场出现了大量波动,因为人们开始想:“等等,我是不是应该彻底重写我对AI的整体看法?” 显然,我们引入了许多优秀的投资者,但他们仍然有一些疑问。不过,他们看了我们的预测后会想:“好吧,我明白了。你们增长得很快,天哪,你们这么快就达到了10亿美元的年化收入,但你们不可能继续保持这种速度。这里有物理定律。你们做的是企业市场,这很好,但采用过程会慢得多。看看云计算花了多长时间,现在还有多少人在用本地部署。”
但业务持续验证了我们的论点:前沿智能的回报非常高。我们真正专注的是,通过产品、市场推广团队和分销渠道实现的模型增长。然后我认为他们也看到了另一个论点:即“打造这项变革性技术很重要,但必须以正确和负责任的方式去做”,这与我们的业务有着非常有趣的联系,而大多数人并不真正理解或相信这一点。那就是,我们不仅投资于模型开发,也投资于AI安全研究。比如,我们开创了可解释性(interpretability)研究,你可以把它想象成模型的MRI(核磁共振成像),可以窥探神经网络内部的工作原理。我们还开创了对齐科学(alignment science),即你希望模型按照你的指令行事,它有多少次做到了,又有多少次偏离了。这些对我们的使命很重要,所以我们做了这些研究。但它们产生了下游效应:事实证明,如果你能看透模型内部,你就能更好地构建它们。
最后一个关联点是,我们现在向《财富》10强中的9家销售。所有这些企业都将客户信息和他们的数据托付给我们。他们的员工在与之互动,有时甚至他们的客户也在与之互动。这些都是最敏感的工作负载。越来越多的业务在Cloud和我们的云平台上运行。我们对安全、可解释性、对齐等方面的投入(并将持续投入),实际上也惠及了企业客户和我们所有的客户。因为如果他们要把所有这些访问权限、所有这些数据,以及在公司最敏感工作流程中工作的能力托付给我们,他们就需要一家值得信赖的公司。我们并非出于这个原因而进行这些投入,但它确实产生了这种下游效应,我们一次又一次地看到,成为一家既处于前沿,又投资于安全、值得信赖的公司,被证明是正确的。
自我加入公司以来,我们已经筹集了750亿美元。根据上个月我们与亚马逊和谷歌敲定的协议,未来还将有500亿美元的资金注入。这是一个巨大的资本数额,但这是一个资本密集型业务,我们需要这些资本来支持增长。但你知道,这一切都归功于业务运行得非常高效。因此,我们筹集这些资本,更多是因为那个“不确定性锥体”(cone of uncertainty),而不是为了弥补公司当前的实际亏损。
主持人:你自己对这个10倍业务增长的10年展望有何看法?第一次发生这种情况时,你自己相信这是可能的吗?这看起来荒谬吗?现在它变得如此持续,也许对你来说已经变得司空见惯了,但你自己当初看着这个锥体时,对连续多年实现10倍增长的可能性是怎么看的?
Krishna Rao:当我加入公司时,它的年化运行收入约为2.5亿美元,计划是达到10亿美元。我说:“很好,哪一年?” 这就是线性思维,对吧?而你知道,Dario一直是比我好得多的收入预测者。我认为随着时间的推移,随着我们对业务的预测和理解越来越好,我们会缩小这个差距。但没错,第一次看到它时,你脑子里全是各种论点:物理定律、大数定律、收入从哪里来、怎么可能增加得这么快、客户怎么可能行动得这么快、这在企业市场甚至可能吗?所有这些想法都会随着时间的推移被打破,因为你看到了公司内部的运作方式,看到了采用曲线和再次发生的指数级增长。我们的收入呈指数级增长,但其背后是许多其他支撑它的指数级增长。你开始看到并相信这一点。现在,这并不意味着我们对预测和情景范围的思考不严谨、不周全。但这确实意味着我的思维方式至少已经从线性和渐进式,更多地转向了拥抱这种指数级增长,并真正相信它的潜力,以及它与其它业务演变方式的不同之处。
主持人:在与每个阶段的投资者交谈时,我相信在你们筹集的每一轮融资中,总会有一些东西是最常见或最难向投资者解释的,或者他们最难以理解和接受的。今天这个东西是什么?
Krishna Rao:我认为是这种算力使用范式。不要把它看作是在某段时间内的可变成本,而要把它看作是一种被高度灵活利用的资源。我们可能在一天的上午用一块芯片进行推理,下午或晚上就用它进行模型开发。这种范式在软件公司或工厂里是不存在的,对吧?如果你有一群人在做研发,这是你的研发费用,他们不能转身去变成生产齿轮,反之亦然。但在我们这样的传统公司里,你确实拥有这种可互换性。我认为这就是算力回报如此重要的原因。我认为人们开始理解这一点了,但仍然有一种倾向,认为“哦,我必须把这两项成本分开”。而实际上,它们是相互强化的,这种灵活性实际上有助于推动短期和长期的收入。
主持人:如果我强迫你离开现在的职位,坐到一家大型投资公司的投资者席位上,然后告诉你,你的工作是去质询这些公司,并投资于最好的公司。那么,你会向那些正在构建模型的实验室或公司提出哪些问题,以真正触及那些不确定、怀疑或可能阻碍它们成为史上最伟大企业的核心问题?我很好奇,从那个角度出发,你会如何处理?
Krishna Rao:我会说几点。首先,整体的算力投资回报率(ROI)是多少?你们是如何利用它的?你们今天看到了什么样的回报?这个回报随时间是如何变化的?对吧?像我们这样的公司正在做前所未有的巨额投资,你们从中产生了什么样的回报?回报何时到来?它的形态是什么?我认为这是第一点。
第二点是,你们的客户如何看待他们从你们这里获得的投资回报率?人们只是在用它做测试,还是真正在有意义的规模上部署它?我可以拿我们的业务举例,我们在这方面看到了大量的证据。我们的年度净美元留存率(net dollar retention rate)超过500%。而且,《财富》10强中的9家都是我们的客户,这些都是真实的客户,做出了重大的采购决策。
就在我来这里的路上,我坐在一辆优步里,在20分钟的车程中签署了两份价值数千万美元的合同。所以,从这个角度看,我们正在见证这一点,并且现在正接受世界上一些最大、最成熟的买家以及市场上有选择权的初创公司的评判,而他们选择了我们。但我认为我经常被问到,或者我会从一个持怀疑态度的投资者席位上问:“你们的客户是如何从中获得回报的?”
也许第三点是,你们如何看待未来的算力,以及它从何而来?因为显然,我们购买算力的一些地方,他们会把算力卖给其他人,也可能在内部使用。随着时间的推移,这种平衡会如何变化?我们的哲学是与顶级玩家合作并保持方案的灵活性。
主持人:有一个疯狂的统计数据,AI这个通用概念在普通民众中的受欢迎程度甚至不如国会,当你第一次听到时会觉得很有趣,但当你认真思考时,你会觉得:“这确实是个问题。” 看起来,那些不在科技行业、不住在湾区或纽约的普通大众,还没有感受到或理解为什么这对他们有益。你认为我们作为一个行业需要做些什么来解决这个问题?
Krishna Rao:如果我们思考正在发生的这场变革,历史上也曾有过其他变革浪潮,对吧?从工业革命、互联网、云计算等等。我认为AI与众不同的一个地方在于,这一切发生得太快了。你可能需要数年甚至数十年才能取得的进展,现在被压缩到了几个月内。回到人类以指数级而非线性方式思考的话题,我认为这可能会让人感到不安。
我们总体上对这项技术的潜力非常乐观。我认为我们作为一个行业可以继续做得更好,更清晰地阐述这一点。Dario写过一篇名为《爱与恩典的机器》(machines of love and grace)的文章,它讲述了这项技术改变我们生活方式的潜力。无论是在药物研发和治愈更常见的疾病,还是在罕见病领域;其次是在医疗保健及其提供方式上,以提高发展中国家和资源匮乏地区的生活标准。我认为所有这些都是AI的承诺和潜力的一部分,所以我们或许可以更好地描绘这幅图景,并希望随着时间的推移展示更多切实的成果。我认为这即将到来,这也是我最乐观的一点。
但另一方面,我们确实(这再次体现了我们的文化)也希望阐明风险。我不认为我们应该只告诉所有人一切都会好起来。因为,你知道,道路上很可能会有颠簸。所以我认为人们通常更倾向于诚实和平衡的评估,对吧?如果我觉得某人只告诉我好消息,却绝口不提坏消息,我就会想:“我真的能信任这个观点吗?” 我认为这就是需要平衡的地方,要承认:“看,当变革在短时间内被压缩时,就会发生一些事情。我们如何在商业和政府之间共同努力,真正提出一些解决方案?”
所以,这关乎清晰地阐述机遇,也关乎认真思考这些解决方案可能是什么。这不是任何一家公司能独自解决的。我们没有能解决一切问题的蓝图,但至少要就其中一些风险、弊端以及我们能做些什么展开对话。然后,我认为在谈论这些问题时,要对这两方面都保持透明。从长远来看,机遇将远远大于那些将要发生的部分风险和弊端。但这并不意味着这条曲线会完美平滑。
主持人:Mythos的发布是一个非常有趣的时刻。这是许多谨慎关注此事的人(包括我的一些朋友)第一次说出类似“这个真的让我有点害怕”的话。所以,这又回到了安全问题。这也是你们第一次站出来说:“我们想确保它不被用于坏事”,这也许是第一个让我们担心可能被用于坏事的模型。我很好奇,在世界得知此事之前,你们内部的讨论是什么样的?围绕它的决策过程是怎样的?就用这个例子来谈谈,随着我们继续前进、规模定律继续成立,究竟有哪些事情让你感到害怕?
Krishna Rao:是的。我认为关于Mythos的一点是,人们可能会误以为它只是一个网络安全模型。它实际上在许多不同维度上都具有非凡的能力。我们发现,网络安全是它能力特别突出的一个领域。因此,这是我们决定以不同方式发布的第一个模型。我们采取这种方式再次与我们的使命和原则一致。我们采用了分阶段的方法,因为我们认为,当一个模型如此强大时(尽管人们关注的是网络安全,但还有其他方面),它可以被用于积极的方面,比如修补代码库。你们已经看到过这样的例子:一个之前的模型在一个开源代码库中发现了22个安全漏洞,而Mythos则发现了250个。这确实有点吓人,但也正是这一点影响了我们的发布方式。我们没有说“我们永远不会发布它”,而是说“让我们分阶段进行,面向一个会随时间扩大的群体,我们可以专注于这种网络安全能力,以及它如何能以防御性而非进攻性的方式被积极使用”。我们认为这是一个未来可以使用的模板,但正因为这一个特定领域,我们希望在发布方式上保持警惕。
主持人:你们现在已经如此庞大,以至于会与所有事物和所有人产生交集。其中一个例子就是,就在几天前,政府表示可能会建立一个新系统,要求公司在向公众发布新模型之前,必须先获得政府的预先批准。显然,你们与战争部(Department of War)有过一段疯狂的经历,我非常好奇那究竟是什么样的经历。现在每个人都在关注这家公司、这项技术以及少数几家正在构建它的公司。你们是如何应对这种情况的?其中一些可能超出了你们的控制,但我相信你们会尽力与各方合作。也许可以谈谈这两个例子,比如政府现在作为一个非常相关的合作伙伴、参与者、监督者等角色。
Krishna Rao:首先,我认为我们非常重视与政府建立牢固的关系,因为我们确实认为监管在未来模型开发中会扮演一定角色。我们在方法上非常“美国优先”。我们希望这项技术能够支持美国以及世界各地的民主国家。这也是我们与政府就Mythos等事项密切合作的原因之一。但我认为这其中需要平衡,对吧?你希望创新能够真正快速地发生,而不被拖慢,但你也希望有一个责任框架来规范这些东西的部署,因为我们长期以来一直表示,这项技术有其影响,我们应该就此进行坦诚的对话,这其中也包括与政府的对话。我认为Mythos的发布过程就是一个很好的例子。
主持人:你能再多跟我们讲讲公司文化吗?比如,你会如何向你的父母描述公司的文化准则?是什么真正驱动了大部分文化?我尤其好奇关于写作的部分。经常听说Dario会不定期地对外发表长篇论述。据我了解,他在内部这样做要频繁得多,公司内部有很强的写作文化。我只是想了解一下,在这家公司工作是什么感觉,它与你曾工作过的其他公司,或与其他试图做同样事情的公司相比,最独特的地方是什么?你对这些差异和独特性的感受是什么?
Krishna Rao:文化是Anthropic一个非常独特的方面。我们确实在外部谈论过它,但当你身处其中、亲身体验时,感觉是不同的。也许我可以跟你分享一些我的观察。
首先,我们有七位联合创始人,这在纸面上看起来行不通,但在实践中却运转得非常好。我认为他们为公司文化和真正重要的事情树立了榜样。我们有文化面试,这并不是一个走过场的形式,而是评估过程中的一个真实环节。所以,一个人可能在其他所有方面都表现出色,是你在这个职位上见过的最聪明的人,但如果他通不过文化考核,我们就不会录用他。
我很喜欢你提出的“如何向父母描述”这个框架:它首先是极度协作的。这意味着我们真的不能容忍山头主义、尖锐的肘击(sharp elbows)或“这事必须是我的功劳”之类的行为。其次,它极度谦逊。你知道,我们的竞争对手都非常有能力,成功远非板上钉钉。我认为这是公司运作方式的一个重要部分。如果我们达到了一个里程碑,发生了好事,地板上不会有彩带,而是会想“下一步是什么”。我认为这正是对使命的关注和一致性贯穿公司文化的表现。
我要说的另一点是,这里有严格的辩论。存在一种智识上的开放和诚实,人们会质疑事情,会真正表达自己的观点,然后围绕它展开富有成效的对话,之后我们会决定前进的方向。在那之后,就会有真正的统一。比如在我们之前谈到的算力分配问题上,人们可能对如何分配算力有不同的看法,但他们会展开深思熟虑的讨论,探讨哪里的回报最高或最好。当他们这样做并做出决定后,就会达成一致,不会有事后猜疑,也不会有政治斗争或山头主义。
文化的另一个特点是它异常透明。Dario通常每两周就会站在全体员工面前,通常会写一份简短的文档,谈论三四个话题,然后回答公司的开放式提问。这些问题都不是软球,也不是事先安排好的,而是员工们心中真实的问题,他会尽其所能地回答。这虽然不是一个决策论坛,但却是公司了解管理层(以及他本人)思考方式的一个窗口,其中也包含辩论和对话。我认为人们非常看重这一点,因为这是一种透明的文化。
此外,七位联合创始人都仍在公司。公司最初的20到30名员工中的绝大多数也仍在公司。我认为,正是这种文化使我们能够吸引并留住业内一些最优秀的人才,对吧?因为我们并不总是给员工最高的薪酬。我们有非常有竞争力的薪酬方案。但当Meta和其他公司为大型语言模型实验室的一些技术人才开出巨额薪酬包时,我想我们只失去了两个人,而其他实验室则失去了几十人。
主持人:对于研究人员来说,业务和文化中的哪些部分让你认为这个数据是真实的?
我认为这确实是由文化所支撑的,这不仅仅是我们自己的感觉。当你与人们交谈时,他们会实证地告诉你:“我想产生最大的影响力。我想在一个地方工作,那里再次体现了人才密度比人才数量更重要的理念。我想在一个真正协作的地方工作,而不是为了某件事而争斗,感觉它没有被恰当地讨论和辩论,或者对决策过程缺乏透明度。” 我认为这确实很重要,因为我们团队中的大多数人只是想做好真正出色的工作,他们被公司的使命所吸引。能够对像我们这样一家公司产生影响的理念——即试图以负责任的方式开发这项变革性技术——我认为这对人们来说真的很重要,不仅限于研究团队,而是遍及整个公司。我们认为这是我们的一大优势,我们对此绝不敢掉以轻心。
我们有“竞优”(race to the top)的概念。我们并不总是拥有所有正确答案,也并非事事完美,但我们希望其他人看到我们做的一些事情后,能够效仿其中的一些做法,从而真正让整个行业的技术发展得更好。我认为人们也被这一点所吸引。再次强调,并非因为我们拥有所有答案,而是因为我们能为如何让这项技术造福人类贡献和引领方向。
主持人:当你与公司内部人员交谈时,前沿对你来说是什么感觉?我指的不仅仅是模型的前沿。我是指在总体上构建AI的下几次“掷骰子”中,前沿是什么感觉?每个人都知道这些东西很强大。每个人都在使用它们。它正在扩散。人们正在逐渐接受它们。从内部来看,你觉得前沿是什么?
Krishna Rao:我认为这是一种理念,再次强调,因为我们专注于企业市场,因为我们真的试图改变经济中知识工作的生产力。我认为这朝着一种“虚拟协作者”(virtual collaborator)的愿景或目标发展。你可以把它想象成一个在你的组织内有上下文、能使用所有特定于你的工具(无论是自研工具还是采购工具)、拥有记忆、能有效地从你和它自己过去犯的错误中学习,并能在很长一段时间内,不仅针对一个任务,而是针对一个真正的想法进行工作的实体。
对我们来说,这意味着模型能力必须继续增长以支持这一点。然后,我们在其上构建的产品可以解锁这种虚拟协作者,我们认为这可以真正加速知识工作。但你必须把它做成合适的形态。对吧?这就是为什么智能不仅仅是单一维度的。它是多方面的,而虚拟协作者结合了其中的许多方面,它不仅仅是一般意义上的聪明,而是针对你的用例的聪明。
对我们来说,Cloud Code在这方面起到了引领作用,我们在该领域也有很多优秀的客户在推动编码前沿。但你也看到了像Co-Work这样的产品出现,并开始比Claude Cloud Code更快地解锁协同工作(如果你以相同的时间点为基准)。这很了不起,因为开发者是这项技术非常快速的采用者。但我认为,这是因为模型能力和产品正在推动这种“虚拟协作者”的概念。甚至我们今天的产品开发也不是由一个产品经理带着两个工程师在三个月内交付什么东西。而是每天都在交付,公司内部有一支智能体舰队在为特定任务工作。每个人都成了管理者。我认为,当它以合适的形态出现时,其带来的生产力提升和影响是巨大的。我们在这方面还处于非常早期的阶段,但其潜力是不可思议的。
主持人:我很好奇,你个人是如何进化以适应这一切的?你听说过很多这样的故事:高管必须与公司一起成长,否则就会被新的高管取代。你知道,你之前的业务是一家很棒的公司,但Cedar的规模只是现在的一个极小部分。所以你们所有人都处在一个前所未有的新事物中。你提到了一个从线性思维转向指数级思维的例子。这只是我想表达的一个方面。但你个人是如何应对的?你做了些什么?最痛苦的是什么?你是如何管理自己的能力,以跟上这个比以往任何事物都增长得更快的东西的?
Krishna Rao:是的,这真的很难。但我认为重要的是要进行第一性原理思考,对吧?每个人在接触新事物时都会有先入为主的观念。进行第一性原理思考,并保持智识上的开放。我花了很多时间和我们的首席计算官Tom Brown在一起。他实际上是公司里第一个面试我的人。我记得在入职前,我们曾在旧金山的Mission区散步,走了两个半小时,他开始向我讲述他对公司未来的愿景。那是在2024年初。老实说,听起来很疯狂。我记得我回家后告诉我妻子:“这将会很疯狂,如果他说的哪怕有10%是真的,这都将颠覆我们所见过的,乃至大多数人所见过的一切范式。” 结果证明,Tom在那次散步中所说的很多话都变成了现实。但我记得那是一个早期的、具有塑造性的时刻,回到家后心想:“天哪,这将完全不同、全新,是一次真正不可思议的经历,但也是一次真正充满挑战的经历。” 这就是它一直以来的样子。
另一点就是招聘优秀的人才。我在面试过程中会告诉应聘者:“我雇用你,并不是把你当作我的直接下属,而是当作一个合作伙伴。我希望你把它当作一种合作关系。这意味着你我之间可能会有分歧。我想听到这些分歧,我想和你一起在白板上讨论。我想了解你的想法。” 我们从世界上一些最好的公司招聘人才,他们带着不同的视角来到这里,可能是来自超大规模云服务商、大型软件公司,或者在另一个时代来自金融服务行业。你知道,我曾在黑石集团的私募股权部门工作过,那种训练非常有价值,能让你在微观层面思考问题,并且不要丢掉这种能力。我不是一个能在五万英尺高空就感到舒服的人,那不适合我。但在这个业务中,你不可能在五百英尺的高度处理所有事情,因为表面积太大了。所以,拥有能在这方面成为合作伙伴的人才真的非常关键。
我认为最后一点是要思考业务如何随时间演变,以及过去可能发生的事情中,有哪些时刻或类比可供参考。你知道,我曾帮助领导Airbnb在疫情期间的融资。那是非常不同的情况,该业务在七周内失去了70%的收入。我知道O'Brien最近刚和你做了一期节目。那是一段令人心惊胆战的时期,但也是一个前所未有、没有现成模板或模式可循的时期,你必须在快速变化的环境中保持清晰的视角。在个人层面,平衡一切——家庭、朋友,当然还有这份工作——确实很难,这份工作无疑会占据你生活的很大一部分。但我每周会尝试在某个安静的时刻想一想:“哇,这真的很酷,能在这个时间点、与这群人、在这个公司、解决这个问题,是一个不可思议的机会。” 我会尝试这样做,也许是在车里,也许是深夜。拥有这种认知和感激之情真的非常重要。
主持人:Tom在散步时告诉你的哪一点听起来最疯狂?
Krishna Rao:我们谈了很多关于算力基础设施的规模,以及模型在短时间内能做到什么。我认为,他描述的世界,我会说有点像科幻小说。但我们现在所经历的很多事情,其根源都在那次谈话中。而且,他谈到的甚至还有更多超越我们今天所处位置的事情。但我认为其中的共通点是,一切都会比我们想象的快得多,其影响和能力都会发生变化。然后,他还对未来抱有非常、非常乐观的态度,我认为这是我们内部常说的“兼顾光明与阴影”(holding light and shade)。这是我从那次谈话中带回来的,除了满脑子的疑问,还有一种对未来的积极感。
主持人:似乎我们大部分时间都在谈论,因为我们确实处于那个锥体的高端。你能想象什么会导致我们转向锥体的低端吗?比如,如果我们现在做一个“事前验尸”(premortem),一年后我们说:“哇,实际上我们并不需要那么多算力。” 你能想象什么会让我们在这个锥体中发生重大转变吗?
Krishna Rao:我认为第一点会是我们客户内部的扩散速度。用例正在追赶模型能力。要知道,我们谈论的是大型组织中的人类,他们有一套长期使用的工具、实践和做事方式,改变是困难的,因此,如果这种扩散遇到障碍、放缓或类似情况,就可能会影响收入增长的速度。
当然,规模定律放缓或失效也会是原因之一。我们没看到这种情况,但我们不能100%确定地说它不会发生。我们当然相信这个轨迹,但模型能力趋于平稳将是另一个因素。
然后,也许第三点是我们如何看待自己处于前沿的地位。今天我们在前沿,我认为我们正在定义智能体AI的前沿。我们需要保持在那里,对吧?这是一个竞争激烈的市场,我们将继续投资于所需的技术、算力和市场推广,以保持领先地位,但这也不是有保证的。
主持人:你最期待什么?你拥有一个得天独厚的位置。你几乎可以亲眼看到未来,因为它正在公司内部发生,而外界还未看到。有了这种视角和位置,你对未来最期待的是什么?
Krishna Rao:我真的很认为,这项技术在生物技术和医疗保健成果方面所能带来的东西,是我最乐观的。我们可能会生活在一个这样的世界里:你被诊断出一种目前无法治愈的疾病,但在你的有生之年,这种疗法可以被更快地找到,你实际上可能不会死于这种疾病。我认为,这就像我们今天所做的很多事情一样,正在帮助加速药物研发过程,对吧?很多所需的文书工作、临床研究报告等,AI和我们的解决方案正在帮助快速加速这一过程。
我最乐观和最兴奋的是,当它进一步深入到药物研发和药物发现领域时会发生什么。因为你知道,人类在研究方面非常有能力,但如果你想到这些分子和蛋白质,它们是如此复杂,微小的变化就会对结果产生巨大的影响,AI在这方面是完美的。如果你想到当实验室的吞吐量提高10倍或100倍时会发生什么,我们可以运行更多的实验,可能会更快地得到更好的结果,这可以帮助全世界的人们,而且不必局限于一小部分疾病或病症,它可以真正深入到更广泛的领域。所以我认为这有潜力极大地改变我们的生活方式和互动方式,这对我来说真的很令人兴奋。
主持人:非常感谢你今天和我聊了这么多。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


