从 Cerebras IPO 聊起：AI 算力变化、Scaling law 的萌芽和百度美研往事_老虎社区_美港股上老虎

从 Cerebras IPO 聊起：AI 算力变化、Scaling law 的萌芽和百度美研往事

访谈 Cerebras 早期投资人周楠。

文丨实习生付自文

编辑丨程曼祺

今年 5 月中旬，美国 AI 芯片与系统公司 Cerebras 登陆纳斯达克。上市一个月内，它的市值一度逼近千亿美元。它被外界视作英伟达的补充，甚至是挑战者。

Cerebras 的特殊性在于它从 2015 年创立之初就选择了一条颠覆性路线：把整片晶圆做成一个巨大的 AI 计算引擎，以减少数据搬运和通信开销。

今天的嘉宾周楠，目前任职于 Qualcomm Ventures，是 Cerebras 的早期投资人之一。9 年前完成这笔投资时，她刚从投行加入百度硅谷人工智能实验室。当时的负责人是吴恩达，Anthropic 创始人 Dario Amodei 也曾在那里工作。

当时的百度美国研究院几乎是全世界 AI 人才密度最高的地方。早在 2016 年，Transformer 尚未发布，他们就形成了一个共识：AI 的进步需要更大的模型、更多的数据、更强的算力。

后来的故事已经成为主流叙事。Transformer 改变了模型架构，scaling law 统一了模型规模与数据、算力之间的语言。但美国头部 VC 真正集体意识到，自己需要重注 AI 而不是 SaaS，已经是 ChatGPT Moment 之后。

很少有人记得，百度曾站在硅谷乃至世界 AI 的前沿，尝试投资新的芯片、数据引擎和前沿模型公司。Cerebras 正是其中一个后来被证明足够重要的项目。

在周楠看来，伟大的投资发生在共识形成之前。但今天 AI 已经成为共识，“非共识” 的窗口变得极短，连头部 VC 都在竞相押注已经跑出圈的公司。因此 Cerebras 上市也是一个提醒：当所有人都在追逐 AI，真正稀缺的不是相信 AI，而是判断下一个发展瓶颈。

从 Cerebras IPO 聊起，推理崛起给了异构芯片机会

晚点：Cerebras 今年 5 月中旬在纳斯达克上市，市值一度逼近千亿美元，现在回到约 500 亿美元。可以先简单介绍一下，这是一家什么公司？

周楠：Cerebras 是我在百度美国研究院时，自己找到、做尽调、一步步建立判断并推动完成投资的第一个项目，当时投的是 C 轮。它不只是一家芯片公司，而是在英伟达 GPU 路线之外，重新设计 AI 训练和推理的计算架构。

它的核心创新是 Wafer-Scale 架构，也就是把整片晶圆做成一个超大的 AI 计算引擎，在单片上集成大量计算核心和片上内存，尽量减少数据搬运和通信开销。Cerebras 同时也做服务器、散热、电源、编译器和软件栈，所以更准确地说，它是一套从芯片到系统的 AI 算力新方案。

晚点：市场对 Cerebras 的一种叙事是 “英伟达挑战者”，实际上呢？

周楠：我们当时投 Cerebras，一个很重要的起点是，百度美国研究院的很多 AI 研究员都在训练模型，他们很早就认为，未来模型会越来越大，数据越来越多，训练迭代需要更强的芯片，不能只依赖英伟达。

十年前的英伟达芯片，也不是专门为深度学习设计的，更多还是服务游戏和图形处理。所以当时我就想，能不能找到更适合深度学习训练的芯片。倒不是一开始就要对抗英伟达，而是要有一个替代方案，避免英伟达的垄断。

但今天 Cerebras 更准确地说，是英伟达在某些特定负载上的挑战者，尤其是推理。但英伟达的护城河也不只是 H100、GB200 这些芯片，还有 CUDA、开发者生态、网络、软件、客户信任和供应链这一整套东西。（注：H100 是上一代主力 AI GPU，GB200 是 Blackwell 架构下 GPU 与 Grace CPU 组合的 AI 计算平台。）

Cerebras 的机会在于，当一些 AI 推理，受限于内存带宽、通信延迟和响应速度时，它会是一个很好的架构选择。它的推理速度，确实比现在很多方案快很多。

晚点：十年前，全球都有类似的创新思潮：Google 的 TPU 自研起步于 2015 年，寒武纪等公司也是 2016 年成立。当时一种观点是，相比通用 GPU 架构，ASIC（专用集成电路）针对深度学习做更多优化。但之后十年，ASIC 并没有撼动通用 GPU 的地位。Cerebras 两三年前的估值还仅是数十亿美元，上市后到了数百亿美元。你觉得这是市场情绪变了还是它的业务和技术真的变了？

周楠：首先是市场需求变了。两三年前，ChatGPT 刚出来，AI 算力已经变成全球稀缺的战略资源，但那时模型能力要不断迭代，大家主要解决的还是模型训练问题，推理（模型使用阶段的算力）需求还没有现在这么大，所以英伟达还是叙事主体。

但现在一半以上的算力都用在推理上，再加上今年 AI Agent 的爆发，又进一步拉动了推理算力的需求。Cerebras 方案里的低延迟、高吞吐就变得更有价值，也更稀缺。它在这个节点上估值爆发，有水到渠成的一面。

晚点：今年的一个明显的利好是，OpenAI 和 Cerebras 签了大额合作，据报道规模超过 200 亿美元。为什么 OpenAI 会对这套方案感兴趣？他们大概会怎么合作？

周楠：首先 Sam Altman 本人是 Cerebras 的投资人。百度是 2017 年投的，他 2016 年就投了。那时 OpenAI 刚成立没多久（注：OpenAI 成立于 2015 年 12 月），说明他很早就意识到，未来模型变大、应用变多之后，不能只依赖英伟达一家。

回到现在，对 OpenAI 这种前沿模型公司来说，算力已经是继续扩展模型的核心瓶颈。即使英伟达很强，它们也一定要分散供应商，找第二种方案。不只是 OpenAI，Anthropic 也在用 Google 的 TPU，大家都在做类似的事。而且推理现在越来越关键，既决定用户体验，也决定模型 API 的毛利。它要低延迟、高吞吐，单个 token 的成本还要持续下降。Cerebras 在这些方面有明显优势，所以对前沿模型公司有吸引力。

晚点：Cerebras 是 Sam Altman 个人投的，也是 OpenAI 的合作方。这个算关联交易吗？

周楠：这些信息只要他披露，不算关联交易。Sam Altman 参与过很多公司和项目，OpenAI 后来也收购了一个与他关系密切的硬件公司。（注：2025 年，OpenAI 宣布收购由前苹果首席设计官 Jony Ive 参与创办的硬件公司 io Products，OpenAI 此前已持有 io 约 23% 股权，后以约 65 亿美元估值完成收购。）

晚点：最近 Cerebras 也宣布和 AWS（亚马逊云科技）合作。但它自己也在做云业务，推出 Cerebras Cloud，这是什么思路？

周楠：我觉得是为了降低客户采用新硬件的门槛。因为他的客户越来越多了，它作为硬件公司很大的挑战，是客户要买一套新系统、部署到自己的数据中心，还要改软件栈，周期很长。

但 Cerebras Cloud 把底层复杂系统封装起来，客户可以直接用 API 接入，不管是训练、推理，还是做应用，都能更快用起来。这对它扩大客户采用很有战略意义。

晚点：其实我最开始看到这个合作时，有一种偏负面的推测：就是如果包了一层云业务，底层用别的算力芯片也可以通过云平台获得收入，这有可能和自有芯片业务左右互搏。但 Cerebras 创始人 Andrew Feldman 最近在彭博科技峰会上强势表态，说会和所有人合作，除了英伟达。

周楠：这和算力短缺有关。现在不只是模型公司缺算力，像 CoreWeave、Nebius 这些新云厂商也缺。GPU 已经成了很大的约束。所以 Cerebras 做云是业务延展，也能增强护城河。对一个模型公司来说，如果找英伟达和周边云厂商还是解决不了算力问题，那从商业角度上，Cerebras 加上云，可能就变成一个更省事的一站式方案。（注：CoreWeave 是美国 AI 云服务商，主要向 AI 公司提供基于英伟达 GPU 的云算力；Nebius 是总部位于阿姆斯特丹的 AI 基础设施公司，提供从 GPU 集群到云平台的一整套 AI 算力服务。）

晚点：总结来说，你现在看到这家公司的上限和下限是什么？

周楠：它的上限很高。现在 AI 算力需求很大，尤其推理的上限，我觉得可能是无止境的。如果它以后做到 5000 亿美元市值，我不会特别惊讶。

下限或者说风险，在于它这套 Wafer-Scale 的方案能不能持续规模化。它现在客户比较集中，和更成熟的芯片厂商相比还不够分散。接下来关键是：能不能扩大客户范围，并且在大规模交付、稳定运营、让客户真正用起来这些环节持续做好。

晚点：Cerebras 这种超大单芯片的架构，规模化交付的难点是什么？

周楠：传统芯片制造，是在一片晶圆上做很多小芯片，切开、封装，再通过 PCB（印刷电路板）、NVLink（NVIDIA 的高速互联技术，用于 GPU 间及部分 CPU-GPU 场景的高带宽通信）这些方式把很多 GPU 连起来。Cerebras 反过来，它尽量不切开晶圆，而是在一整片晶圆上做一个巨大的 AI 计算引擎，相当于把八十多个芯片级模块无缝连在一起。好处是，计算单元、内存和通信网络都在同一个硅片上，数据不用频繁从一个芯片搬到另一个芯片，也减少了外部 HBM（High Bandwidth Memory，高带宽内存）和计算单元之间的数据搬运，所以能加速计算。

GPU 的优势是生态成熟、通用性强；Cerebras 的优势，是在推理等负载里减少分布式通信和内存搬运。

但代价也很明显。我们当时投的时候，担心的风险很多，包括封装、散热、良率等等。不过现在它已经上市，很多早期工程风险应该都解决了。未来进一步放量生产后的良率确实是一个问题，这个我们后面讲风险的时候可以再展开聊。

晚点：其实英伟达自己也有相关动作。比如它在去年底以 200 亿美元收购了推理芯片公司 Groq 的团队。（注：以非独家推理技术授权协议的形式，Groq 仍作为独立公司运营。）

周楠：对，Groq 当时我也看过，它的思路和 Cerebras 很像，都是在尝试不同于 GPU 的计算架构。所以 Cerebras 的问题还是它能不能在客户侧迅速起规模。

回到 2016：Dario 发现 Scaling Law 雏形，百度寻找新架构芯片

晚点：回到最初在 2017 年投资 Cerebras 时，为什么会开始看 Cerebras 这类新 AI 算力方向？

周楠：我当时加入百度之前在巴克莱银行（英国大型跨国银行与金融集团，后收购雷曼兄弟北美业务）做投行业务，在香港，正好赶上中国移动互联网公司上市潮，做过阿里、京东这些案子，也做过一家芯片公司的上市。

2016 年，百度在全球找 AI 投资人，加入他们在硅谷的人工智能研究院，和吴恩达一起工作。我就是在这个背景下进了百度。相当于是从投行转到投资，从卖方转到买方。而且我比较幸运的是，一开始就进入了一个纯 AI 的环境。那时候很多人还没有在投 AI，但我每天就在一个 AI 研究院里工作。

晚点：2016 年移动互联网还处在收获期，但 AI 还在很早期，为什么会想从投行转向 AI 早期投资？

周楠：其实是因为之前做过一家搜索公司的上市，最后没成功，但它在招股书里讲了一个 AI 故事。那是我第一次接触 AI，当时就觉得，这是未来。后来知道百度 2014 年邀请吴恩达去美国人工智能研究院，我也在硅谷听过几次他的讲座，就对百度产生了很强的兴趣。2015 年底看到他们在招 AI 投资人，我就投了简历。

晚点：当时百度硅谷 AI Lab 已成立 2 年，它是一个什么状态？

周楠：那会儿应该是硅谷最强的 AI 实验室之一，吴恩达的号召力非常强，百度也愿意给预算买 GPU、训练模型。他很早就把 GPU 作为训练 AI 模型的核心算力系统推到台前。如果没有他当时的背书，大家可能不会那么快认识到 GPU 可以被大规模用于 AI 训练。

当时研究院人才密度非常高，Dario Amodei（Anthropic 联合创始人、CEO）当时也在百度。很多研究员后来去了 OpenAI，或者成了后来前沿 AI 实验室的早期核心成员。

大家做的方向也很多，包括语音模型、视觉模型，也有零售、金融科技、医疗、自动驾驶等等。但内部有一个很强的共识，尤其是 Deep Speech 2 之后，大家看到 AI 进步依赖三件事：更大的模型、更多的数据、更强的算力。

这就有一个很朴素的判断：如果 AI 要持续进步，底层算力会非常重要。而 GPU 虽然是当时最好的工具，但它不是从零开始为深度学习设计的，所以我花了大概半年时间，把 AI 从训练、架构、数据到模型能力这一套重新学了一遍。到 2017 年，我就开始到处找不同于 GPU 的新算力系统。

晚点：可以把 2015 年发布的 Deep Speech 2 这篇论文展开讲讲。这篇论文的一作就是 Dario，后来它被认为是阐述 scaling law 雏形的早期研究之一。

周楠：我加入时，这篇论文已经发了。当时大家还没有把 scaling law 用今天这种数学化、系统化的方式表达出来，但已经有一个很强的经验直觉：模型更大、数据更多、训练更久、算力更强，模型效果就会持续提升。后来语言模型时代把这件事理论化了，但往回看，scaling law 诞生的萌芽就是这篇论文。

晚点：百度内部，那会儿这个研究成果就很受重视吗？

周楠：这个结论是很直接的投资启发：如果 AI 能力要继续提升，就需要更强的计算系统。那时候还没有现在说的训练、后训练这些概念，就是很朴素地看模型、数据、训练时间和算力。

我印象很深的是，当时百度已经在训练接近 3 亿参数的语言模型，这在十年前非常大。研究员们跟我说，用 GPU 训练一次要三个多月。我当时就听傻了：如果训练一次要几个月，那调参、迭代怎么办？所以当我后来看到 Cerebras，说它的架构可以把深度学习训练效率提高一千倍，把几个月的训练缩到几天或几周，这个吸引力就非常强。

晚点：沿着这个思路，你当时还看了哪些公司？

周楠：看了挺多，有 Graphcore、Wave Computing，还有一些做 ASIC 的公司。但 ASIC 更适合做推理芯片，而当时我们最想解决训练问题。所以最后真正让我重点尽调的，主要是 Graphcore、Wave Computing 和 Cerebras 三家。

晚点：为什么选了 Cerebras？

周楠：现在记不太清当时每个细节，印象里 Graphcore 也能提速，不过架构没有 Cerebras 那么颠覆（Graphcore 开发了不同于传统 GPU 的架构的 IPU：Intelligence Processing Unit）。作为投资人，我当时更想投一个真正可能把深度学习训练提速百倍、千倍的架构。Wave Computing 的理念和 Cerebras 有点像，但团队配置有些问题，所以是最早被淘汰的。

晚点：所以当时三选一，最后选到了目前看结果最好的一家。

周楠：当时 Cerebras 的信号非常明显。Andrew Feldman 前一家公司 SeaMicro 被 AMD 收购（注：2012 年 2 月，交易金额约 3.34 亿美元），他几乎带着原班人马出来，围绕一个全新架构创办 Cerebras。公司才一年多，团队八十多人，接近七十个博士，他们的工作经验加起来有好几百年，是我见过的博士密度最高的公司。创始人很有号召力。

晚点：你具体是怎么接触到 Cerebras 的？

周楠：我 2017 年初还不认识 Cerebras，是上半年后期才接触到。当时我把 Coatue 的创始合伙人 Thomas Laffont 请到百度，他正好也懂半导体。我跟他聊我们对 AI 算力的判断，他很兴奋，就说他们投了一家很颠覆的公司，叫 Cerebras。我当时已经看过 Graphcore、Wave Computing，但都还在犹豫，Cerebras 一出现就眼前一亮。

晚点：Andrew 本科读的是经济学和政治学，后来又拿了斯坦福 MBA，早年主要做市场和产品，并不是芯片工程师出身，这会让你有疑虑吗？

周楠：芯片公司创始人大多是工程师背景，但后来我觉得 Cerebras 反而是一个很好的组合。Cerebras 是系统级公司，Andrew 的强项是产品定义、组织团队、理解客户和坚持长期愿景。他身边有很强的技术联创，而且都是跟了他很多年的人。

另外，Andrew 也是连续创业者，在行业里面有很深厚的关系网。他很清楚自己的优势和客户的痛点。我当时带着百度 AI 研究员做了很深的尽调，问他良率、散热、电源、编译器、客户为什么要买，他都不回避，一个个拆开讲。我当时还是芯片小白，他可以每天跟我讲两小时，连续讲四个星期。

他不只是能讲愿景，也能从第一性原理把风险拆清楚。对投资人来说，投深科技不是只投宏大叙事，而是要知道风险到底是什么，以及有没有办法去对冲这些风险。

晚点：研究员支持你们做尽调，是组织安排的还是他们自己驱动的？

周楠：当时像 Greg Diamos 这些研究员，自己就在训练大模型，真实的痛点就是太慢了。所以我把 Cerebras 这个架构带到他们面前时，他们也很兴奋，很想知道它到底行不行。Greg 是 Deep Speech 2 的作者之一，也是英伟达构建 CUDA 生态的关键人物，所以他的判断对我们很重要。（注：Greg Diamos 离开百度后，曾加入吴恩达创办的 Landing AI 早期团队，后又参与创办企业大模型平台 Lamini。）

其实当时 Cerebras 还没有正式流片，只有模拟。那时能真正帮它验证模拟的公司只有百度等非常少的几家，那时还没有 Transformer（注：Transformer 由 Google 于 2017 年 6 月发布，百度硅谷 AI Lab 开始寻找、投资 AI 芯片公司是在 2016 年下半年至 2017 年），百度的大语言模型最先是基于一个自研的框架 PaddlePaddle。我们把模型跑到 Cerebras 的模拟器上，看它在假设良率、编译器、散热、封装都成立的情况下，是否真的能带来很大提升。最终结果是非常好的，这在某种程度上也验证了他们的想法。后来也有一些百度研究员和 Cerebras 合作很深，甚至加入了 Cerebras。

晚点：理论验证之后，良率、散热、封装这些具体的硬件风险，你们是怎么判断的？

周楠：我们找了斯坦福教授、芯片专家，也问了百度内部做自动驾驶硬件的人。硬件风险其实可以一项项拆。比如良率问题，如果第一次流片失败，要多花多久成本？我们当时测算，最坏可能多花六个月、500 万到 1000 万美元，综合公司的现金流，当时结论是风险可控。

散热、电源、封装这些也一样。Cerebras 当时已经有液冷系统方案，也有软件层面的故障应对机制。编译层面则是 Greg 他们重点测算的，包括模型怎么映射到这个架构上，怎么和 TensorFlow、Keras、PyTorch 这些框架、API 和客户数据中心对接。所以没有百度美研这些研究员和硬件专家，我是很难把这些风险看清楚的。当时那一批硬件专家，很多现在也在做 GPU 的创业。（注：TensorFlow、PyTorch 都是开源深度学习框架，Keras 是高级神经网络 API，早期常与 TensorFlow 搭配使用，强调快速搭建深度学习模型。）

现在回看，百度当时做的技术尽调，可能是早期投资人里最深入的一份。我也把结论跟 Benchmark、Coatue 这些更早期投资人分享过，他们听完以后也安心了不少。

晚点：Cerebras 后来上投决会是什么过程？当时是哪些人一起做决策？

周楠：当时投决会里有我的老板 Jennifer Li（李昕晢，百度 CFO），还有陆奇和 Robin（李彦宏）。我写了十几页投资备忘录，中英文都有，发上去不到两天就通过了。回头看觉得自己很幸运，因为后来见过很多 CVC、IVC 的投决流程，才知道百度当时这个投决会多有眼光。对这种非共识、颠覆性的算力系统，百度从上到下都很支持，基本是无痛通过。（注：CVC 即企业风险投资，Corporate Venture Capital，指大公司设立的投资部门或基金；IVC 即独立风险投资机构，Independent Venture Capital，通常指不隶属于大公司的专业 VC。）

晚点：吴恩达当时不在投决会上？

周楠：到投资 Cerebras 时，吴恩达已经离开百度了。

晚点：当时百度管理层有没有考虑说流片之后再投？

周楠：没有。他们没有干涉这个判断。百度那么早成立美国人工智能研究院，李彦宏那时候也很早就去竞标 Geoffrey Hinton 的实验室，所以他们对这种颠覆性投资本来就是支持的。

晚点：你还记得当时估值是多少吗？

周楠：不便宜，差不多 7 亿多美元。放在 2016、2017 年，快到独角兽了。我当时测算 2025 年 AI 训练市场大概 220 亿美元，按 Cerebras 20% 左右市占率，投资回报大概 3 到 5 倍。现在看，这个判断太保守了，我完全低估了 AI 腾飞的速度。

晚点：但是你当时测算的市占率挺高，有 20%。而现在 Cerebras 的市占率是很小的，收入和订单金额大，是因为整个盘子大。为什么它的市占率不如预期？

周楠：对。2017 到 2019 年，Cerebras 其实经历过很艰难的阶段，流片也有推迟。我们当时测算过的那些下行风险，基本都发生了，比如流片延迟一两年。所以回头看，这个团队很有韧性。虽然它现在市占率还不高，但这个架构本身已经跑出来了，接下来就是在推理市场扩张。

训练市场我觉得不是没有机会，只是前沿模型公司已经在英伟达 GPU 上形成了训练体系，让它们换训练芯片，风险比较大。相比之下，Cerebras 在推理场景里更容易切进去，所以现在很多客户需求也集中在推理。

晚点：OpenAI 200 亿美元的订单还没完全交付，这个阶段能说它在推理市场成功了吗？推理也需要基础设施配合，它的算力结构很特殊，会不会导致生态改动很大？

周楠：肯定需要一些定制化。公司已经到这个体量了，为 OpenAI 这样的订单去定制基础设施，是必要的。关键就是看它能多快交付。

晚点：他们自己的团队能搞定吗？

周楠：我认为可以。Cerebras 早期八十多人里有很多博士，人才结构很全面，里面有相当多人就是做基础设施和系统的。

可能也会有一些外部合作，比如做 agentic AI 基础设施的公司。因为 AI Agent 会带来大量推理负载，这和 Cerebras 的低延迟、高吞吐优势很匹配。如果能和这些基础设施公司配合起来，它的工作负载跑起来会更顺。

晚点：如果 2017 到 2019 年，Cerebras 流片更快，现在的算力格局会不会不同？

周楠：可能会不一样。OpenAI 当年训练模型，是黄仁勋把 GPU 送过去。如果那时候 Cerebras 已经成熟，也许是 Andrew 拿着机器送过去，历史可能会被更多改写。

晚点：那得特别快。因为 2017 年 Transformer 发布之后，OpenAI 就开始探索这个方向了。

周楠：对，而且现在前沿模型公司的 GPU 集群、数据中心基建已经投下去了，要在这时换到其他的芯片上去，其实是很大的系统风险。

晚点：这可能也跟半导体行业的周期有关。硬件迭代本来就长，客户会很看重稳定性、良率和规模交付。英伟达 GPU 毕竟是软硬件都积累多年的产品。Cerebras 即使更快流片，也很难立刻改变格局，新方案还要经过物理制造验证。

周楠：对，规模生产交付、编译器和软硬件生态都得跟上。达不到理想状态，前沿模型公司就不会接受。

晚点：这也是它和大模型公司、软件公司不同的地方。

周楠：但现在是个好机会。今天算力需求里相当大一部分是推理，Cerebras 的优势会更明显。所以与其纠结训练市场，不如把推理负载做好，战略上去吃推理市场是比较正确的决定。

题图来源：Cerebras（创始团队 2022 年在计算机历史博物馆，从左至右依次为 Sean Lie, Gary Lauterbach, Michael James, Jean-Philippe Fricker 和 Andrew Feldman。）

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

推荐
最新

暂无评论