AI 下半场，谁能把 Token 变成钱？_老虎社区_美港股上老虎

AI 下半场，谁能把 Token 变成钱？

如果只用一句话概括这一轮AI产业链的变化，我会说：市场先买了缺货，现在开始买回报。

过去两年，AI投资最容易讲的故事是稀缺。谁有GPU，谁能拿到HBM，谁能更快把数据中心点亮，谁就拥有市场最强的定价权。英伟达、HBM、服务器、光模块、液冷、电力和数据中心，都被放进同一个框架里重新定价。

但到了今天，单纯讲算力不够已经不够了。

我更愿意把AI看成一条新的工业链条：上游生产Token，中游制造、调度和分发Token，下游把Token变成结果。市场最关心的问题，也从有没有算力，变成这些算力最后能不能变成收入、利润和现金流。

更关键的是，Token已经不只是模型厂商的计费单位，而是在成为AI时代的统一价值尺度。行业矛盾正在从算力供给约束，转向Token供需的结构性分化：总量供给阶段性趋于过剩，但高价值Token依然短缺。另有研究基于2020到2026年的模型报价数据估算，Token价格整体已经大幅下降，但旗舰推理模型仍保留显著的reasoningpremium。

这意味着，便宜的是通用Token，值钱的是能够完成复杂任务、产生业务结果的Token。

AI下半场，真正稀缺的不是消耗Token的能力，而是把Token烧成客户ROI的能力。

从算力稀缺，到TokenROI定价

我更愿意把这一阶段理解为：AI产业开始从生产要素稀缺，转向生产要素回报率。

这背后的逻辑并不复杂。通用问答、轻内容生成、低门槛调用，会随着硬件迭代、算法优化和开源竞争不断便宜；但复杂推理、长上下文、多工具调用、持续执行的任务链，反而会因为结果价值更高而保持溢价。

所以，Token不是整体变便宜之后就失去投资意义。真正发生的是分层：高端Token通胀，中低端Token通缩，任务层Token通胀。普通问答会越来越便宜，复杂任务会越来越贵；低价值调用会越来越像标准化电力，高价值任务则会越来越像专业服务。

这也是我不再把Token降价简单理解为利空的原因。平均价格不是核心，单位Token能不能转化成明确结果才是核心。

过去的AI投资，很多时候是在买谁能生产更多Token。接下来，市场会更在意谁能提高Token转化率，也就是单位Token带来的收入或成本节约。换句话说，Token不再只是成本项，而是要像电力、水、带宽一样，被放进企业的ROI公式里重新定价。

这也是整条产业链价值分配正在重构的原因。上游仍然掌握成本锚，但中游凭调度效率和交付能力开始拿到更多利润，下游只有在能把Token转成业务结果时，才真正获得第二层定价权。

层级旧逻辑新逻辑量化锚点上游供给稀缺，先拿定价权仍是成本锚，但ROIC边际回落Token成本中电力和算力折旧占比约70%到80%；上游营收增速2026Q1为65.47%中游算力搬运与封装Token制造、调度与交付中心中游CapEx/D&A2026Q1为3.57倍；典型AI云合同毛利率约35%下游成本承受方只有把Token变成结果，才有第二层定价权下游营收增速由约5%升至21.64%

这张图的核心不是说上游不重要，而是说产业定价方式变了。AI上半场，最强逻辑是生产能力稀缺；AI下半场，更强逻辑是结果能力稀缺。

投资时钟为什么开始转向中下游

如果只看短期股价，很容易误以为上游故事还远没结束。但如果把财务指标拉长看，投资时钟已经在悄悄变化。

美股七巨头按照上游芯片、中游云平台、下游应用终端拆开后，最重要的变化不是上游失速，而是剪刀差收敛。2024年上半年，上游营收增速大约是中游的20倍、下游的35倍；到2026年一季度，这个差距已经收敛到上游65.47%、中游18.73%、下游21.64%。上游仍然最快，但已经不是绝对单极驱动。

与之对应的，是上游ROIC在2024年四季度见顶后回落，中游CapEx/D&A升到3.57倍，成为整个链条里投资强度最高的环节。下游则从低增长区域开始修复，进入营收改善、利润率待修复、预期差扩大的阶段。

这不是说上游没有机会，而是上游最容易赚估值扩张的钱的阶段，正在过去。上游现在更像高景气、低预期差；中游像高投入、等兑现；下游则开始进入营收改善、利润率修复和估值重估的窗口。

之所以愿意给中游更高权重，不只是因为云厂还在砸钱，更因为它们正在从买卡的人，变成卖结果的人。这个变化在Oracle身上看得很清楚。

Oracle的意义不在于它代表所有云厂商，而在于它把AI云到底赚不赚钱这个问题摆到了台面上。OCI当前毛利率大致在中30%区间，典型6年、600亿美元AI合同的生命周期毛利率约35%，税前无杠杆IRR约19.5%。这个回报不等于传统软件的高毛利，但已经说明AI云并不天然是资本黑洞。

真正的问题在时间错配。订单表走得很快，利润表会慢一些。预上电、预租赁、预折旧这些前置扩容成本，会在FY26到FY28阶段压低已报告毛利率。中游平台不是没有回报，而是回报要穿过capex、折旧、容量上线、利用率和客户验收，才会逐步体现。

这就是AI云和传统软件最大的不同。

软件业务是轻资产、高毛利、现金流快释放；AI云是重资产、长周期、前置投入、回报后置。市场可以接受它重，但不能接受它说不清楚为什么重。

中游比拼的不是最大模型，而是Token智能密度

现在看中游，已经很少先问谁模型最大，而是先问谁的Token最划算。

Token智能密度，是理解中游竞争的一个重要概念。简单说，就是在单位资源约束下，模型能输出多少有效智能。资源包括参数规模、算力、显存、能耗和时延；有效智能则体现在推理、工具调用、多模态处理和任务执行。

这个概念特别适合今天。行业已经从训练一个更大的模型，走到了怎么把模型更便宜、更稳定、更高吞吐地卖出去。客户不会只看榜单分数，而会关心同样完成一个任务，谁的成本更低，谁的时延更稳，谁的成功率更高，谁能更安全地接入企业系统。

模型价格和能力分化已经开始体现这一点。旗舰模型价格并没有像很多人想象中那样无限下探，很多高能力模型仍然维持溢价；与此同时，非旗舰模型价格持续下降，国内模型在调用量上快速追赶，美国厂商则更多占据高ARPU企业场景。

中游大概率会分成两条路：一条是低价开源做规模，一条是高价值闭源做ARPU。真正有定价权的，不是最便宜的那家，而是能把高能力、低时延、企业级交付装进同一份合同里的那家。

另外一个容易被低估的点，是中游正在成为价值制造厂，而不仅是价值过路费。AI云合同本身可能只有中等毛利率，但如果叠加数据库、多云、数据治理、企业软件接口、安全权限、工作流封装，整体价值会被继续放大。

这也是为什么中游未来的胜负手，不只是GPU堆得够不够快，而是调度、网络、数据库、模型路由、企业封装这些非芯片能力能不能形成持续复利。

换句话说，云厂商会越来越像Token的电网公司。它们既要建设基础设施，也要调度模型、分配算力、优化成本、保证稳定性，还要把复杂技术封装成企业愿意购买的服务。

Agent把Token需求改写成任务复杂度税

如果说过去两年AI最重要的变化是什么，我的答案不是模型更聪明，而是调用方式变了。

传统聊天式调用，Token消耗大体跟问题次数线性相关；Agent不同，它把一次调用扩成了一条任务链。一次复杂任务可能要经历拆解、检索、调用工具、执行、校验、修正，每一步都会把新的内容写回上下文，继续喂给模型。

这样一来，决定成本的就不再是一问一答，而是任务有多长、多复杂、要不要反复试错。

这不是抽象推演，数据已经很明显。2025年内，推理模型Token占比从几乎可以忽略，升到年底超过50%；平均Prompt长度从约1.5K提升到6K以上，平均序列长度从不到2000token升到5400token以上。国内侧也出现了类似加速，到2026年3月，国内日均Token调用量已经超过140万亿，相比2024年初增长1400倍。

更扎实的证据来自Agenticcoding。最新研究分析了SWE-benchVerified上的八个前沿模型轨迹，结论非常直接：Agent式编码任务的Token消耗，最高可以比普通代码聊天和推理高出三个数量级；同一个任务不同运行之间的总Token消耗，差异可达30倍，而且更贵并不自动意味着更高成功率。

另一篇多Agent软件工程研究也发现，自动化代码审查和反复修正阶段，占走了平均59.4%的Token，输入Token始终是成本大头。

这会直接改写商业模式。

传统SaaS最常见的是按席位收费，但Agent的成本波动太大。轻度用户和重度用户的推理成本可能完全不是一个量级。如果仍然只靠固定订阅，厂商很容易出现收入增长慢于推理成本增长的问题。

未来Agent产品不会回到单一席位定价，而会越来越像订阅保底、按量超额、按任务计价、结果分成的混合体。

Agent时代，最大的危险不是没人用，而是用得越多亏得越多。产品演示越复杂，越要算清楚背后的单任务成本。成本模型不闭环，爆款也可能变成利润黑洞。

下游真正会重估的是高ROI场景

我最不认同的一种说法，是AI应用全面开花，所以应用层会普涨。

现实不会这样简单。

真正值得重估的，不是有AI的应用，而是能把Token变成业务结果的应用。筛选框架可以很简单：综轴看Token消耗密度，横轴看场景ROI。越靠右上，越可能承接AI应用重估。

排在最前面的不是泛娱乐，也不是轻办公，而是编程/研发、工业AI/预测维护、金融风控/合规、企业办公/知识管理。核心原因很简单：这些场景任务价值高、错误成本高、流程复杂，客户愿意为成功率和可靠性付费。

代码开发对应工程师效率和交付速度；工业AI对应设备停机、良率改善和预测维护；金融风控合规对应错误成本、监管压力和审核效率；企业知识管理对应组织内部信息流、决策效率和流程自动化。客户不是为AI好玩付费，而是为降本、增收、控风险、提效率付费。

海外案例已经开始分化。

Palantir是最鲜明的例子。2026Q1收入同比增长85%至16.3亿美元，AIP相关收入占比提升到79%，同比增长104%，同时维持高毛利、高现金流和GAAP盈利。它的核心不是把AI做成一个插件，而是把AI变成企业决策和运营系统里的高价值能力。

ServiceNow也在走类似路线。使用NowAssist的高价值大客户数量同比增长130%，说明企业Agent并不是没有需求，而是正在从PoC往预算科目里走。

但Salesforce的例子提醒我们，AI应用商业化并不会自动兑现。Agentforce年化收入已经超过10亿美元，但最新CIO调查显示，真正付费使用其Agent工具的比例仍然偏低。市场对它能否把演示能力变成确定性业务，依然存在疑问。

这就是下游应用最残酷的地方：流量不是壁垒，功能不是壁垒，只有能让客户在财务上算得过账的结果，才是真正壁垒。

SaaS的分化：AI是增量，还是侵蚀

SaaS是这一轮AI应用重估里最值得看的方向，但它不会整体受益。

AI对SaaS有两种完全不同的影响：一种是增量，一种是侵蚀。

如果AI能带来更高ARPU、更强续费、更高客户粘性和新的付费模块，它就是增量；如果AI只是增加研发成本、推理成本和服务器成本，却没有带来明显付费提升，那就是侵蚀。

看起来产品更聪明了，利润率却更差了，这是很多SaaS公司接下来要面对的现实。

历史上的云化SaaS行情，对应过比较高的PS估值区间；而当前国内多数SaaS公司估值已经回落。接下来会不会修复，不取决于它有没有AI概念，而取决于AI能不能带来ARPU、续费、合同负债、收费模式和交付效率的实质改善。

放到国内映射上，我会这样看：

金山办公是工具型入口，优势是AI可以直接嵌进高频工作流，考核点不是故事，而是会员提价、AI付费渗透和ARPU。

同花顺是数据与流程锁定型入口，核心看AI是否强化交易、投研和金融数据生态粘性。

金蝶更像企业管理与知识工作流入口，价值在于ERP、CRM、知识管理和Agent结合，但落地周期会更长。

深信服则偏安全与基础设施入口，优势在于把AI塞进网络、安全、运维这些刚需场景。

它们的共同点不是都能重估，而是都必须回答同一个问题：AI是收入增量，还是利润侵蚀？

回答得清楚，估值才有修复空间；回答不清楚，就只是多了一层成本。

能源和液冷开始决定上游天花板

很多人还在用GPU数量理解上游，但我越来越觉得，上游的下一个关键变量不是芯片本身，而是电。

Token总成本中，电力和算力折旧合计占比接近70%到80%。这意味着AI基础设施扩张一旦越过芯片阶段，下一步必然锚定到电力获取、PUE、冷却效率和算电协同。

国内数据已经很直观。智能算力规模预计到2028年达到2781.9EFlops，2023到2028年复合增速约46.2%。到2030年，在高情景下，我国算力中心用电量可能超过7000亿千瓦时，占全社会用电量5.3%。

全球层面，数据中心耗电也在快速上升。到2030年，AI数据中心已经不再是互联网配套设施，而是在变成电力系统里的新型工业负荷。

液冷则把这个约束具体化。机柜功率密度上升、PUE标准收紧、面积受限、芯片高温故障率上升，使液冷从可选变成必选。国内液冷服务器市场规模预计2026年达到257亿元，渗透率达到37%，2027年超过50%，2030年达到82%。

这说明，上游未来比拼的，不只是拿到多少芯片，更是能不能以更低PUE、更高液冷渗透、更稳MW上线节奏，把Token生产出来。

如果说GPU是AI上半场的瓶颈，那么电力和液冷就是AI下半场的硬约束。Token工厂不是普通数据中心，它要求算、电、热、网一起优化。

AI产业链已经进入TokenROI定价阶段。

上游不是结束了，而是从高弹性走向兑现；中游不是只有故事，而是要证明智能密度、调度效率和资本回报；下游不是全面繁荣，而是只奖励那些能把Token烧成客户结果的场景。

Agent会把Token需求继续放大，但也会把商业模式从席位制推向按量、按任务、按结果的混合体；能源和液冷则会成为下一轮上游扩张最硬的约束。

我会用五个硬指标观察这条产业链：

看高价值Token的溢价，而不是只看模型均价。

看中游的上线MW、利用率与backlog兑现，而不是只看订单。

看下游的ARPU、续费、合同负债和现金流，而不是只看DAU。

看Agent的单任务成本和收费模型是否闭环。

看电力、PUE、液冷渗透率和园区交付，而不是只看芯片份额。

最终判断标签是：

上游仍强，但从弹性进入兑现；中游提效，核心看资本回报；下游重估，但分化会更残酷。AI下半场，真正值钱的不是消耗Token，而是把Token烧成客户愿意付费的结果。

本文内容整理自中国银河证券计算机行业策略、公司公开披露、学术研究及公开资料，数据与观点来源于上述资料，仅供参考，不构成任何投资建议。

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

推荐
最新

暂无评论