从 Cerebras IPO 聊起:AI 算力变化、Scaling law 的萌芽和百度美研往事
访谈 Cerebras 早期投资人周楠。
文丨实习生付自文
编辑丨程曼祺
今年 5 月中旬,美国 AI 芯片与系统公司 Cerebras 登陆纳斯达克。上市一个月内,它的市值一度逼近千亿美元。它被外界视作英伟达的补充,甚至是挑战者。
Cerebras 的特殊性在于它从 2015 年创立之初就选择了一条颠覆性路线:把整片晶圆做成一个巨大的 AI 计算引擎,以减少数据搬运和通信开销。
今天的嘉宾周楠,目前任职于 Qualcomm Ventures,是 Cerebras 的早期投资人之一。9 年前完成这笔投资时,她刚从投行加入百度硅谷人工智能实验室。当时的负责人是吴恩达,Anthropic 创始人 Dario Amodei 也曾在那里工作。
当时的百度美国研究院几乎是全世界 AI 人才密度最高的地方。早在 2016 年,Transformer 尚未发布,他们就形成了一个共识:AI 的进步需要更大的模型、更多的数据、更强的算力。
后来的故事已经成为主流叙事。Transformer 改变了模型架构,scaling law 统一了模型规模与数据、算力之间的语言。但美国头部 VC 真正集体意识到,自己需要重注 AI 而不是 SaaS,已经是 ChatGPT Moment 之后。
很少有人记得,百度曾站在硅谷乃至世界 AI 的前沿,尝试投资新的芯片、数据引擎和前沿模型公司。Cerebras 正是其中一个后来被证明足够重要的项目。
在周楠看来,伟大的投资发生在共识形成之前。但今天 AI 已经成为共识,“非共识” 的窗口变得极短,连头部 VC 都在竞相押注已经跑出圈的公司。因此 Cerebras 上市也是一个提醒:当所有人都在追逐 AI,真正稀缺的不是相信 AI,而是判断下一个发展瓶颈。
从 Cerebras IPO 聊起,推理崛起给了异构芯片机会
晚点:Cerebras 今年 5 月中旬在纳斯达克上市,市值一度逼近千亿美元,现在回到约 500 亿美元。可以先简单介绍一下,这是一家什么公司?
周楠:Cerebras 是我在百度美国研究院时,自己找到、做尽调、一步步建立判断并推动完成投资的第一个项目,当时投的是 C 轮。它不只是一家芯片公司,而是在英伟达 GPU 路线之外,重新设计 AI 训练和推理的计算架构。
它的核心创新是 Wafer-Scale 架构,也就是把整片晶圆做成一个超大的 AI 计算引擎,在单片上集成大量计算核心和片上内存,尽量减少数据搬运和通信开销。Cerebras 同时也做服务器、散热、电源、编译器和软件栈,所以更准确地说,它是一套从芯片到系统的 AI 算力新方案。
晚点:市场对 Cerebras 的一种叙事是 “英伟达挑战者”,实际上呢?
周楠:我们当时投 Cerebras,一个很重要的起点是,百度美国研究院的很多 AI 研究员都在训练模型,他们很早就认为,未来模型会越来越大,数据越来越多,训练迭代需要更强的芯片,不能只依赖英伟达。
十年前的英伟达芯片,也不是专门为深度学习设计的,更多还是服务游戏和图形处理。所以当时我就想,能不能找到更适合深度学习训练的芯片。倒不是一开始就要对抗英伟达,而是要有一个替代方案,避免英伟达的垄断。
但今天 Cerebras 更准确地说,是英伟达在某些特定负载上的挑战者,尤其是推理。但英伟达的护城河也不只是 H100、GB200 这些芯片,还有 CUDA、开发者生态、网络、软件、客户信任和供应链这一整套东西。(注:H100 是上一代主力 AI GPU,GB200 是 Blackwell 架构下 GPU 与 Grace CPU 组合的 AI 计算平台。)
Cerebras 的机会在于,当一些 AI 推理,受限于内存带宽、通信延迟和响应速度时,它会是一个很好的架构选择。它的推理速度,确实比现在很多方案快很多。
晚点:十年前,全球都有类似的创新思潮:Google 的 TPU 自研起步于 2015 年,寒武纪等公司也是 2016 年成立。当时一种观点是,相比通用 GPU 架构,ASIC(专用集成电路)针对深度学习做更多优化。但之后十年,ASIC 并没有撼动通用 GPU 的地位。Cerebras 两三年前的估值还仅是数十亿美元,上市后到了数百亿美元。你觉得这是市场情绪变了还是它的业务和技术真的变了?
周楠:首先是市场需求变了。两三年前,ChatGPT 刚出来,AI 算力已经变成全球稀缺的战略资源,但那时模型能力要不断迭代,大家主要解决的还是模型训练问题,推理(模型使用阶段的算力)需求还没有现在这么大,所以英伟达还是叙事主体。
但现在一半以上的算力都用在推理上,再加上今年 AI Agent 的爆发,又进一步拉动了推理算力的需求。Cerebras 方案里的低延迟、高吞吐就变得更有价值,也更稀缺。它在这个节点上估值爆发,有水到渠成的一面。
晚点:今年的一个明显的利好是,OpenAI 和 Cerebras 签了大额合作,据报道规模超过 200 亿美元。为什么 OpenAI 会对这套方案感兴趣?他们大概会怎么合作?
周楠:首先 Sam Altman 本人是 Cerebras 的投资人。百度是 2017 年投的,他 2016 年就投了。那时 OpenAI 刚成立没多久(注:OpenAI 成立于 2015 年 12 月),说明他很早就意识到,未来模型变大、应用变多之后,不能只依赖英伟达一家。
回到现在,对 OpenAI 这种前沿模型公司来说,算力已经是继续扩展模型的核心瓶颈。即使英伟达很强,它们也一定要分散供应商,找第二种方案。不只是 OpenAI,Anthropic 也在用 Google 的 TPU,大家都在做类似的事。而且推理现在越来越关键,既决定用户体验,也决定模型 API 的毛利。它要低延迟、高吞吐,单个 token 的成本还要持续下降。Cerebras 在这些方面有明显优势,所以对前沿模型公司有吸引力。
晚点:Cerebras 是 Sam Altman 个人投的,也是 OpenAI 的合作方。这个算关联交易吗?
周楠:这些信息只要他披露,不算关联交易。Sam Altman 参与过很多公司和项目,OpenAI 后来也收购了一个与他关系密切的硬件公司。(注:2025 年,OpenAI 宣布收购由前苹果首席设计官 Jony Ive 参与创办的硬件公司 io Products,OpenAI 此前已持有 io 约 23% 股权,后以约 65 亿美元估值完成收购。)
晚点:最近 Cerebras 也宣布和 AWS(亚马逊云科技)合作。但它自己也在做云业务,推出 Cerebras Cloud,这是什么思路?
周楠:我觉得是为了降低客户采用新硬件的门槛。因为他的客户越来越多了,它作为硬件公司很大的挑战,是客户要买一套新系统、部署到自己的数据中心,还要改软件栈,周期很长。
但 Cerebras Cloud 把底层复杂系统封装起来,客户可以直接用 API 接入,不管是训练、推理,还是做应用,都能更快用起来。这对它扩大客户采用很有战略意义。
晚点:其实我最开始看到这个合作时,有一种偏负面的推测:就是如果包了一层云业务,底层用别的算力芯片也可以通过云平台获得收入,这有可能和自有芯片业务左右互搏。但 Cerebras 创始人 Andrew Feldman 最近在彭博科技峰会上强势表态,说会和所有人合作,除了英伟达。
周楠:这和算力短缺有关。现在不只是模型公司缺算力,像 CoreWeave、Nebius 这些新云厂商也缺。GPU 已经成了很大的约束。所以 Cerebras 做云是业务延展,也能增强护城河。对一个模型公司来说,如果找英伟达和周边云厂商还是解决不了算力问题,那从商业角度上,Cerebras 加上云,可能就变成一个更省事的一站式方案。(注:CoreWeave 是美国 AI 云服务商,主要向 AI 公司提供基于英伟达 GPU 的云算力;Nebius 是总部位于阿姆斯特丹的 AI 基础设施公司,提供从 GPU 集群到云平台的一整套 AI 算力服务。)
晚点:总结来说,你现在看到这家公司的上限和下限是什么?
周楠:它的上限很高。现在 AI 算力需求很大,尤其推理的上限,我觉得可能是无止境的。如果它以后做到 5000 亿美元市值,我不会特别惊讶。
下限或者说风险,在于它这套 Wafer-Scale 的方案能不能持续规模化。它现在客户比较集中,和更成熟的芯片厂商相比还不够分散。接下来关键是:能不能扩大客户范围,并且在大规模交付、稳定运营、让客户真正用起来这些环节持续做好。
晚点:Cerebras 这种超大单芯片的架构,规模化交付的难点是什么?
周楠:传统芯片制造,是在一片晶圆上做很多小芯片,切开、封装,再通过 PCB(印刷电路板)、NVLink(NVIDIA 的高速互联技术,用于 GPU 间及部分 CPU-GPU 场景的高带宽通信)这些方式把很多 GPU 连起来。Cerebras 反过来,它尽量不切开晶圆,而是在一整片晶圆上做一个巨大的 AI 计算引擎,相当于把八十多个芯片级模块无缝连在一起。好处是,计算单元、内存和通信网络都在同一个硅片上,数据不用频繁从一个芯片搬到另一个芯片,也减少了外部 HBM(High Bandwidth Memory,高带宽内存)和计算单元之间的数据搬运,所以能加速计算。
GPU 的优势是生态成熟、通用性强;Cerebras 的优势,是在推理等负载里减少分布式通信和内存搬运。
但代价也很明显。我们当时投的时候,担心的风险很多,包括封装、散热、良率等等。不过现在它已经上市,很多早期工程风险应该都解决了。未来进一步放量生产后的良率确实是一个问题,这个我们后面讲风险的时候可以再展开聊。
晚点:其实英伟达自己也有相关动作。比如它在去年底以 200 亿美元收购了推理芯片公司 Groq 的团队。(注:以非独家推理技术授权协议的形式,Groq 仍作为独立公司运营。)
周楠:对,Groq 当时我也看过,它的思路和 Cerebras 很像,都是在尝试不同于 GPU 的计算架构。所以 Cerebras 的问题还是它能不能在客户侧迅速起规模。
回到 2016:Dario 发现 Scaling Law 雏形,百度寻找新架构芯片
晚点:回到最初在 2017 年投资 Cerebras 时,为什么会开始看 Cerebras 这类新 AI 算力方向?
周楠:我当时加入百度之前在巴克莱银行(英国大型跨国银行与金融集团,后收购雷曼兄弟北美业务)做投行业务,在香港,正好赶上中国移动互联网公司上市潮,做过阿里、京东这些案子,也做过一家芯片公司的上市。
2016 年,百度在全球找 AI 投资人,加入他们在硅谷的人工智能研究院,和吴恩达一起工作。我就是在这个背景下进了百度。相当于是从投行转到投资,从卖方转到买方。而且我比较幸运的是,一开始就进入了一个纯 AI 的环境。那时候很多人还没有在投 AI,但我每天就在一个 AI 研究院里工作。
晚点:2016 年移动互联网还处在收获期,但 AI 还在很早期,为什么会想从投行转向 AI 早期投资?
周楠:其实是因为之前做过一家搜索公司的上市,最后没成功,但它在招股书里讲了一个 AI 故事。那是我第一次接触 AI,当时就觉得,这是未来。后来知道百度 2014 年邀请吴恩达去美国人工智能研究院,我也在硅谷听过几次他的讲座,就对百度产生了很强的兴趣。2015 年底看到他们在招 AI 投资人,我就投了简历。
晚点:当时百度硅谷 AI Lab 已成立 2 年,它是一个什么状态?
周楠:那会儿应该是硅谷最强的 AI 实验室之一,吴恩达的号召力非常强,百度也愿意给预算买 GPU、训练模型。他很早就把 GPU 作为训练 AI 模型的核心算力系统推到台前。如果没有他当时的背书,大家可能不会那么快认识到 GPU 可以被大规模用于 AI 训练。
当时研究院人才密度非常高,Dario Amodei(Anthropic 联合创始人、CEO)当时也在百度。很多研究员后来去了 OpenAI,或者成了后来前沿 AI 实验室的早期核心成员。
大家做的方向也很多,包括语音模型、视觉模型,也有零售、金融科技、医疗、自动驾驶等等。但内部有一个很强的共识,尤其是 Deep Speech 2 之后,大家看到 AI 进步依赖三件事:更大的模型、更多的数据、更强的算力。
这就有一个很朴素的判断:如果 AI 要持续进步,底层算力会非常重要。而 GPU 虽然是当时最好的工具,但它不是从零开始为深度学习设计的,所以我花了大概半年时间,把 AI 从训练、架构、数据到模型能力这一套重新学了一遍。到 2017 年,我就开始到处找不同于 GPU 的新算力系统。
晚点:可以把 2015 年发布的 Deep Speech 2 这篇论文展开讲讲。这篇论文的一作就是 Dario,后来它被认为是阐述 scaling law 雏形的早期研究之一。
周楠:我加入时,这篇论文已经发了。当时大家还没有把 scaling law 用今天这种数学化、系统化的方式表达出来,但已经有一个很强的经验直觉:模型更大、数据更多、训练更久、算力更强,模型效果就会持续提升。后来语言模型时代把这件事理论化了,但往回看,scaling law 诞生的萌芽就是这篇论文。
晚点:百度内部,那会儿这个研究成果就很受重视吗?
周楠:这个结论是很直接的投资启发:如果 AI 能力要继续提升,就需要更强的计算系统。那时候还没有现在说的训练、后训练这些概念,就是很朴素地看模型、数据、训练时间和算力。
我印象很深的是,当时百度已经在训练接近 3 亿参数的语言模型,这在十年前非常大。研究员们跟我说,用 GPU 训练一次要三个多月。我当时就听傻了:如果训练一次要几个月,那调参、迭代怎么办?所以当我后来看到 Cerebras,说它的架构可以把深度学习训练效率提高一千倍,把几个月的训练缩到几天或几周,这个吸引力就非常强。
晚点:沿着这个思路,你当时还看了哪些公司?
周楠:看了挺多,有 Graphcore、Wave Computing,还有一些做 ASIC 的公司。但 ASIC 更适合做推理芯片,而当时我们最想解决训练问题。所以最后真正让我重点尽调的,主要是 Graphcore、Wave Computing 和 Cerebras 三家。
晚点:为什么选了 Cerebras?
周楠:现在记不太清当时每个细节,印象里 Graphcore 也能提速,不过架构没有 Cerebras 那么颠覆(Graphcore 开发了不同于传统 GPU 的架构的 IPU:Intelligence Processing Unit)。作为投资人,我当时更想投一个真正可能把深度学习训练提速百倍、千倍的架构。Wave Computing 的理念和 Cerebras 有点像,但团队配置有些问题,所以是最早被淘汰的。
晚点:所以当时三选一,最后选到了目前看结果最好的一家。
周楠:当时 Cerebras 的信号非常明显。Andrew Feldman 前一家公司 SeaMicro 被 AMD 收购(注:2012 年 2 月,交易金额约 3.34 亿美元),他几乎带着原班人马出来,围绕一个全新架构创办 Cerebras。公司才一年多,团队八十多人,接近七十个博士,他们的工作经验加起来有好几百年,是我见过的博士密度最高的公司。创始人很有号召力。
晚点:你具体是怎么接触到 Cerebras 的?
周楠:我 2017 年初还不认识 Cerebras,是上半年后期才接触到。当时我把 Coatue 的创始合伙人 Thomas Laffont 请到百度,他正好也懂半导体。我跟他聊我们对 AI 算力的判断,他很兴奋,就说他们投了一家很颠覆的公司,叫 Cerebras。我当时已经看过 Graphcore、Wave Computing,但都还在犹豫,Cerebras 一出现就眼前一亮。
晚点:Andrew 本科读的是经济学和政治学,后来又拿了斯坦福 MBA,早年主要做市场和产品,并不是芯片工程师出身,这会让你有疑虑吗?
周楠:芯片公司创始人大多是工程师背景,但后来我觉得 Cerebras 反而是一个很好的组合。Cerebras 是系统级公司,Andrew 的强项是产品定义、组织团队、理解客户和坚持长期愿景。他身边有很强的技术联创,而且都是跟了他很多年的人。
另外,Andrew 也是连续创业者,在行业里面有很深厚的关系网。他很清楚自己的优势和客户的痛点。我当时带着百度 AI 研究员做了很深的尽调,问他良率、散热、电源、编译器、客户为什么要买,他都不回避,一个个拆开讲。我当时还是芯片小白,他可以每天跟我讲两小时,连续讲四个星期。
他不只是能讲愿景,也能从第一性原理把风险拆清楚。对投资人来说,投深科技不是只投宏大叙事,而是要知道风险到底是什么,以及有没有办法去对冲这些风险。
晚点:研究员支持你们做尽调,是组织安排的还是他们自己驱动的?
周楠:当时像 Greg Diamos 这些研究员,自己就在训练大模型,真实的痛点就是太慢了。所以我把 Cerebras 这个架构带到他们面前时,他们也很兴奋,很想知道它到底行不行。Greg 是 Deep Speech 2 的作者之一,也是英伟达构建 CUDA 生态的关键人物,所以他的判断对我们很重要。(注:Greg Diamos 离开百度后,曾加入吴恩达创办的 Landing AI 早期团队,后又参与创办企业大模型平台 Lamini。)
其实当时 Cerebras 还没有正式流片,只有模拟。那时能真正帮它验证模拟的公司只有百度等非常少的几家,那时还没有 Transformer(注:Transformer 由 Google 于 2017 年 6 月发布,百度硅谷 AI Lab 开始寻找、投资 AI 芯片公司是在 2016 年下半年至 2017 年),百度的大语言模型最先是基于一个自研的 框架 PaddlePaddle。我们把模型跑到 Cerebras 的模拟器上,看它在假设良率、编译器、散热、封装都成立的情况下,是否真的能带来很大提升。最终结果是非常好的,这在某种程度上也验证了他们的想法。后来也有一些百度研究员和 Cerebras 合作很深,甚至加入了 Cerebras。
晚点:理论验证之后,良率、散热、封装这些具体的硬件风险,你们是怎么判断的?
周楠:我们找了斯坦福教授、芯片专家,也问了百度内部做自动驾驶硬件的人。硬件风险其实可以一项项拆。比如良率问题,如果第一次流片失败,要多花多久成本?我们当时测算,最坏可能多花六个月、500 万到 1000 万美元,综合公司的现金流,当时结论是风险可控。
散热、电源、封装这些也一样。Cerebras 当时已经有液冷系统方案,也有软件层面的故障应对机制。编译层面则是 Greg 他们重点测算的,包括模型怎么映射到这个架构上,怎么和 TensorFlow、Keras、PyTorch 这些框架、API 和客户数据中心对接。所以没有百度美研这些研究员和硬件专家,我是很难把这些风险看清楚的。当时那一批硬件专家,很多现在也在做 GPU 的创业。(注:TensorFlow、PyTorch 都是开源深度学习框架,Keras 是高级神经网络 API,早期常与 TensorFlow 搭配使用,强调快速搭建深度学习模型。)
现在回看,百度当时做的技术尽调,可能是早期投资人里最深入的一份。我也把结论跟 Benchmark、Coatue 这些更早期投资人分享过,他们听完以后也安心了不少。
晚点:Cerebras 后来上投决会是什么过程?当时是哪些人一起做决策?
周楠:当时投决会里有我的老板 Jennifer Li(李昕晢,百度 CFO),还有陆奇和 Robin(李彦宏)。我写了十几页投资备忘录,中英文都有,发上去不到两天就通过了。回头看觉得自己很幸运,因为后来见过很多 CVC、IVC 的投决流程,才知道百度当时这个投决会多有眼光。对这种非共识、颠覆性的算力系统,百度从上到下都很支持,基本是无痛通过。(注:CVC 即企业风险投资,Corporate Venture Capital,指大公司设立的投资部门或基金;IVC 即独立风险投资机构,Independent Venture Capital,通常指不隶属于大公司的专业 VC。)
晚点:吴恩达当时不在投决会上?
周楠:到投资 Cerebras 时,吴恩达已经离开百度了。
晚点:当时百度管理层有没有考虑说流片之后再投?
周楠:没有。他们没有干涉这个判断。百度那么早成立美国人工智能研究院,李彦宏那时候也很早就去竞标 Geoffrey Hinton 的实验室,所以他们对这种颠覆性投资本来就是支持的。
晚点:你还记得当时估值是多少吗?
周楠:不便宜,差不多 7 亿多美元。放在 2016、2017 年,快到独角兽了。我当时测算 2025 年 AI 训练市场大概 220 亿美元,按 Cerebras 20% 左右市占率,投资回报大概 3 到 5 倍。现在看,这个判断太保守了,我完全低估了 AI 腾飞的速度。
晚点:但是你当时测算的市占率挺高,有 20%。而现在 Cerebras 的市占率是很小的,收入和订单金额大,是因为整个盘子大。为什么它的市占率不如预期?
周楠:对。2017 到 2019 年,Cerebras 其实经历过很艰难的阶段,流片也有推迟。我们当时测算过的那些下行风险,基本都发生了,比如流片延迟一两年。所以回头看,这个团队很有韧性。虽然它现在市占率还不高,但这个架构本身已经跑出来了,接下来就是在推理市场扩张。
训练市场我觉得不是没有机会,只是前沿模型公司已经在英伟达 GPU 上形成了训练体系,让它们换训练芯片,风险比较大。相比之下,Cerebras 在推理场景里更容易切进去,所以现在很多客户需求也集中在推理。
晚点:OpenAI 200 亿美元的订单还没完全交付,这个阶段能说它在推理市场成功了吗?推理也需要基础设施配合,它的算力结构很特殊,会不会导致生态改动很大?
周楠:肯定需要一些定制化。公司已经到这个体量了,为 OpenAI 这样的订单去定制基础设施,是必要的。关键就是看它能多快交付。
晚点:他们自己的团队能搞定吗?
周楠:我认为可以。Cerebras 早期八十多人里有很多博士,人才结构很全面,里面有相当多人就是做基础设施和系统的。
可能也会有一些外部合作,比如做 agentic AI 基础设施的公司。因为 AI Agent 会带来大量推理负载,这和 Cerebras 的低延迟、高吞吐优势很匹配。如果能和这些基础设施公司配合起来,它的工作负载跑起来会更顺。
晚点:如果 2017 到 2019 年,Cerebras 流片更快,现在的算力格局会不会不同?
周楠:可能会不一样。OpenAI 当年训练模型,是黄仁勋把 GPU 送过去。如果那时候 Cerebras 已经成熟,也许是 Andrew 拿着机器送过去,历史可能会被更多改写。
晚点:那得特别快。因为 2017 年 Transformer 发布之后,OpenAI 就开始探索这个方向了。
周楠:对,而且现在前沿模型公司的 GPU 集群、数据中心基建已经投下去了,要在这时换到其他的芯片上去,其实是很大的系统风险。
晚点:这可能也跟半导体行业的周期有关。硬件迭代本来就长,客户会很看重稳定性、良率和规模交付。英伟达 GPU 毕竟是软硬件都积累多年的产品。Cerebras 即使更快流片,也很难立刻改变格局,新方案还要经过物理制造验证。
周楠:对,规模生产交付、编译器和软硬件生态都得跟上。达不到理想状态,前沿模型公司就不会接受。
晚点:这也是它和大模型公司、软件公司不同的地方。
周楠:但现在是个好机会。今天算力需求里相当大一部分是推理,Cerebras 的优势会更明显。所以与其纠结训练市场,不如把推理负载做好,战略上去吃推理市场是比较正确的决定。
题图来源:Cerebras(创始团队 2022 年在计算机历史博物馆,从左至右依次为 Sean Lie, Gary Lauterbach, Michael James, Jean-Philippe Fricker 和 Andrew Feldman。)
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


