本财报季,人工智能的成本开始在财务数据中显现。Meta(META.US)、Shopify(SHOP.US)、Spotify(SPOT.US)和 Pinterest(PINS.US)都指出,不断上涨的人工智能和推理成本正在拖累利润率。Shopify 表示,规模经济效益“部分被不断上涨的大语言模型(LLM)成本所抵消”。
这正是支撑 OpenAI 和 Anthropic 预期 IPO 估值(预计均超过 8000 亿美元)的定价模式的代价。这些估值基于一个假设:OpenAI 和 Anthropic 将保持其市场份额和定价权——竞争对手难以追赶,企业客户将继续支付溢价,因为目前没有真正的替代方案。
中国模型的“限制倒逼优势”:从1%到60%的惊人跃迁
但越来越多的数据指向相反的方向。尖端人工智能正变得丰富且廉价。中国实验室对类似工作的收费仅为美国实验室的几分之一。与此同时,英伟达(NVDA.US)、Cohere、Reflection 和 Mistral等竞争者正在企业打造更便宜、更小型、更高效的替代方案。等到 OpenAI 和 Anthropic 提交招股说明书时(OpenAI 的保密文件最早可能在本周提交),它们估值的核心前提可能已经遭遇打击。
成本差距巨大,而且还在不断扩大。企业人工智能预算激增。云成本公司 CloudZero 的一项调查显示,约 45% 的受访公司表示,到 2025 年,它们每月在人工智能上的支出将超过 10 万美元,高于前一年的 20%。这些资金的去向变得越来越重要。人工智能基准测试公司 Artificial Analysis 对所有主流模型进行相同的 10 项评估,并追踪总成本。对于各实验室最强大的模型:Anthropic 的 Claude 成本为 4,811 美元;OpenAI 的 ChatGPT 为 3,357 美元;DeepSeek 为 1,071 美元;Kimi 为 948 美元;智谱的 GLM 为 544 美元。Claude 的成本几乎是同等工作负载下最便宜的中国替代方案的九倍。
就连谷歌(GOOGL.US)也力挺创新云。在本周的I/O开发者大会上,首席执行官桑达尔·皮查伊表示,“许多公司已经耗尽了年度词元预算,而现在才五月”,并力荐谷歌更经济的Flash模型作为解决方案。皮查伊指出,如果谷歌云最大的客户将其80%的工作负载从前沿模型迁移到Gemini 3.5 Flash,每年将节省超过10亿美元。谷歌承认企业需要更经济的选择。
而且,这些低成本的替代方案也已不再落后。去年引发美国科技股抛售潮的中国人工智能实验室DeepSeek,上个月发布了其新一代模型的预览版,该模型在编码、智能体和知识基准测试方面与OpenAI、Anthropic和谷歌的最新模型不相上下,甚至几乎相同。过去四个月里,包括北京月之暗面、小米和智谱在内的其他中国实验室也发布了性能水平相近的模型。
Databricks 首席执行官 Ali Ghodsi 对这一转变有着实时的观察。该公司的 AI 网关连接着数千家企业客户和他们正在使用的模型,Ghodsi 表示,该产品的收入正在迅速增长。
他指出,企业正在部署的技术被称为“顾问模型”。默认情况下,大部分工作由一个廉价的开源模型完成。当遇到无法解决的任务时,它会使用一个工具调用 OpenAI 或 Anthropic 的前沿模型来寻求帮助。“这样可以有效地控制成本,”Ghodsi 说。
这种转变的速度令人瞩目。在 OpenRouter 上,开发者可以通过单一界面访问数百个 AI 模型,中国模型的使用率从 2024 年的约 1% 飙升至 5 月份的 60% 以上。
供应商也开始将降低成本作为一种产品进行销售。Figma首席执行官迪伦·菲尔德表示,企业在人工智能应用方面正经历三个阶段:第一阶段,几乎无人使用;第二阶段,人人都必须使用,甚至有人“竞相用词元消费”;第三阶段,企业意识到“大家都在过度消费”,必须削减开支。他表示,许多企业目前正处于第三阶段。Figma 正在销售一些功能,可以将客户的词元消耗量降低 20% 到 30%。
中国模型的“限制倒逼优势”与美国实验室的应对措施
成本差距反映了双方的架构差异。美国的前沿实验室投入数千亿美元的资本支出,使用英伟达最昂贵的芯片训练规模越来越大的模型,而美国的电网容量增长速度却跟不上。这些成本最终都转嫁给了客户。对于中国实验室而言,限制已成为一种策略。由于受到芯片出口限制,企业被迫积极优化——用更少的计算资源训练出具有竞争力的模型,并提高运行效率。
受影响较小的美国实验室主要是哪些面向敏感数据的模型。Cohere 首席执行官 Aidan Gomez 表示,该公司专门向银行、国防机构和其他受监管行业销售人工智能模型,这些买家无论价格如何都避开选择中国模型。去年,Cohere 的收入增长了六倍,这主要得益于其面向该细分市场的销售。但这只是更广泛的企业市场中相对较小的一部分。在安全和合规要求较为宽松的受监管行业之外,支付溢价的理由就越来越难以成立。
美国的应对措施正在形成。从人工智能热潮中获利最多的公司英伟达现在公开推广一种不同的模式,发布其自主研发的人工智能系统,任何公司都可以免费下载并在自己的服务器上运行,以此作为中国模型以及 OpenAI 和 Anthropic 等公司封闭式模型的替代方案。Reflection AI 的估值高达数十亿美元,其目标正是为希望获得本土替代方案的企业构建美国开源模型。这两家公司都资金雄厚,并且明确瞄准了同一个市场空白——功能强大、价格低于前沿技术、部署在美国企业已经信赖的基础设施上的模型。
反对这一转变的理由主要集中在国家安全方面。但这种反对意见在实践中正在瓦解。即使是美国政府的人工智能安全研究所(AI Safety Institute)曾指出DeepSeek模型在安全性和性能方面落后于美国模型,但该研究所记录也显示,自2025年1月R1版本发布以来,DeepSeek模型的下载量增长了近1000%。
Anthropic公司自身也承认面临压力。该公司在5月份发布的一份政策文件中表示,美国模型仅比中国模型“领先几个月”,并警告称,中国“在成本方面正赢得全球应用”。
OpenAI则持不同看法。一位熟悉该公司想法的人士表示,包括上个月发布的GPT-5.5在内的每一个新前沿模型的发布,都推动了API和产品使用量的激增,企业需求增长势头强劲,他们称之为“垂直增长”。这位人士表示,开源在低风险任务中发挥着作用,但并未侵蚀公司的核心业务。定价压力并非该公司十大担忧之一。
但一位不愿透露姓名的企业人工智能首席执行官却提出了不同的看法。他认为增长是真实存在的——“但如果不使用这项技术,前沿科技的发展速度会更快。”
估值与现实的碰撞:S-1文件将暴露什么?
OpenAI 和 Anthropic 预计将寻求公开投资者对它们进行估值。两家公司的估值均接近万亿美元,因此 S-1 文件中必须展现出足以支撑如此高估值的企业收入增长和市场集中度。然而,支撑如此高估值的溢价,恰恰在这两家公司需要占据主导地位的细分市场中,正以最快的速度消退。
首先是营收集中度风险。Counterpoint Research数据显示,2026年第一季度Anthropic以31.4%的收入份额领跑全球大语言模型市场,略高于OpenAI的29%-1。但Anthropic约80%收入来自企业客户,而OpenAI约为40%——这意味着Anthropic对少数大客户的依赖度更高,任何一家大客户的“降本增效”决策都可能对其收入增速产生显著影响。
其次是盈利路径的差异。市场信息显示,Anthropic预计2028年盈亏平衡,比OpenAI的2030年目标提前两年-1。这一差距并非财务细节,而是“在一个算力成本巨大、盈利能力模糊的行业中最重要的变量”。2026年,Anthropic年化营收从2025年底的90亿美元飙升至5月的450亿美元,五个月增长500%-2。但即便如此高速的增长,能否在公开市场兑现万亿估值,仍取决于投资者是否相信这一增速可以持续——而在降价潮中,维持增速恰恰是最困难的部分。
OpenAI方面,一位熟悉内情的人士表示,包括GPT-5.5在内的每一个新前沿模型发布都推动了API和产品使用量激增,企业需求增长势头强劲,“开源在低风险任务中发挥作用,但并未侵蚀公司的核心业务。”这一判断或许正确,但它回避了一个更根本的问题:当“低风险任务”覆盖了企业中绝大部分AI调用量时,“核心业务”还剩下多大?
精彩评论