AI 下半场,谁能把 Token 变成钱?
如果只用一句话概括这一轮AI产业链的变化,我会说:市场先买了缺货,现在开始买回报。
过去两年,AI投资最容易讲的故事是稀缺。谁有GPU,谁能拿到HBM,谁能更快把数据中心点亮,谁就拥有市场最强的定价权。英伟达、HBM、服务器、光模块、液冷、电力和数据中心,都被放进同一个框架里重新定价。
但到了今天,单纯讲算力不够已经不够了。
我更愿意把AI看成一条新的工业链条:上游生产Token,中游制造、调度和分发Token,下游把Token变成结果。市场最关心的问题,也从有没有算力,变成这些算力最后能不能变成收入、利润和现金流。
更关键的是,Token已经不只是模型厂商的计费单位,而是在成为AI时代的统一价值尺度。行业矛盾正在从算力供给约束,转向Token供需的结构性分化:总量供给阶段性趋于过剩,但高价值Token依然短缺。另有研究基于2020到2026年的模型报价数据估算,Token价格整体已经大幅下降,但旗舰推理模型仍保留显著的reasoningpremium。
这意味着,便宜的是通用Token,值钱的是能够完成复杂任务、产生业务结果的Token。
AI下半场,真正稀缺的不是消耗Token的能力,而是把Token烧成客户ROI的能力。
从算力稀缺,到TokenROI定价
我更愿意把这一阶段理解为:AI产业开始从生产要素稀缺,转向生产要素回报率。
这背后的逻辑并不复杂。通用问答、轻内容生成、低门槛调用,会随着硬件迭代、算法优化和开源竞争不断便宜;但复杂推理、长上下文、多工具调用、持续执行的任务链,反而会因为结果价值更高而保持溢价。
所以,Token不是整体变便宜之后就失去投资意义。真正发生的是分层:高端Token通胀,中低端Token通缩,任务层Token通胀。普通问答会越来越便宜,复杂任务会越来越贵;低价值调用会越来越像标准化电力,高价值任务则会越来越像专业服务。
这也是我不再把Token降价简单理解为利空的原因。平均价格不是核心,单位Token能不能转化成明确结果才是核心。
过去的AI投资,很多时候是在买谁能生产更多Token。接下来,市场会更在意谁能提高Token转化率,也就是单位Token带来的收入或成本节约。换句话说,Token不再只是成本项,而是要像电力、水、带宽一样,被放进企业的ROI公式里重新定价。
这也是整条产业链价值分配正在重构的原因。上游仍然掌握成本锚,但中游凭调度效率和交付能力开始拿到更多利润,下游只有在能把Token转成业务结果时,才真正获得第二层定价权。
层级旧逻辑新逻辑量化锚点上游供给稀缺,先拿定价权仍是成本锚,但ROIC边际回落Token成本中电力和算力折旧占比约70%到80%;上游营收增速2026Q1为65.47%中游算力搬运与封装Token制造、调度与交付中心中游CapEx/D&A2026Q1为3.57倍;典型AI云合同毛利率约35%下游成本承受方只有把Token变成结果,才有第二层定价权下游营收增速由约5%升至21.64%
这张图的核心不是说上游不重要,而是说产业定价方式变了。AI上半场,最强逻辑是生产能力稀缺;AI下半场,更强逻辑是结果能力稀缺。
投资时钟为什么开始转向中下游
如果只看短期股价,很容易误以为上游故事还远没结束。但如果把财务指标拉长看,投资时钟已经在悄悄变化。
美股七巨头按照上游芯片、中游云平台、下游应用终端拆开后,最重要的变化不是上游失速,而是剪刀差收敛。2024年上半年,上游营收增速大约是中游的20倍、下游的35倍;到2026年一季度,这个差距已经收敛到上游65.47%、中游18.73%、下游21.64%。上游仍然最快,但已经不是绝对单极驱动。
与之对应的,是上游ROIC在2024年四季度见顶后回落,中游CapEx/D&A升到3.57倍,成为整个链条里投资强度最高的环节。下游则从低增长区域开始修复,进入营收改善、利润率待修复、预期差扩大的阶段。
这不是说上游没有机会,而是上游最容易赚估值扩张的钱的阶段,正在过去。上游现在更像高景气、低预期差;中游像高投入、等兑现;下游则开始进入营收改善、利润率修复和估值重估的窗口。
之所以愿意给中游更高权重,不只是因为云厂还在砸钱,更因为它们正在从买卡的人,变成卖结果的人。这个变化在Oracle身上看得很清楚。
Oracle的意义不在于它代表所有云厂商,而在于它把AI云到底赚不赚钱这个问题摆到了台面上。OCI当前毛利率大致在中30%区间,典型6年、600亿美元AI合同的生命周期毛利率约35%,税前无杠杆IRR约19.5%。这个回报不等于传统软件的高毛利,但已经说明AI云并不天然是资本黑洞。
真正的问题在时间错配。订单表走得很快,利润表会慢一些。预上电、预租赁、预折旧这些前置扩容成本,会在FY26到FY28阶段压低已报告毛利率。中游平台不是没有回报,而是回报要穿过capex、折旧、容量上线、利用率和客户验收,才会逐步体现。
这就是AI云和传统软件最大的不同。
软件业务是轻资产、高毛利、现金流快释放;AI云是重资产、长周期、前置投入、回报后置。市场可以接受它重,但不能接受它说不清楚为什么重。
中游比拼的不是最大模型,而是Token智能密度
现在看中游,已经很少先问谁模型最大,而是先问谁的Token最划算。
Token智能密度,是理解中游竞争的一个重要概念。简单说,就是在单位资源约束下,模型能输出多少有效智能。资源包括参数规模、算力、显存、能耗和时延;有效智能则体现在推理、工具调用、多模态处理和任务执行。
这个概念特别适合今天。行业已经从训练一个更大的模型,走到了怎么把模型更便宜、更稳定、更高吞吐地卖出去。客户不会只看榜单分数,而会关心同样完成一个任务,谁的成本更低,谁的时延更稳,谁的成功率更高,谁能更安全地接入企业系统。
模型价格和能力分化已经开始体现这一点。旗舰模型价格并没有像很多人想象中那样无限下探,很多高能力模型仍然维持溢价;与此同时,非旗舰模型价格持续下降,国内模型在调用量上快速追赶,美国厂商则更多占据高ARPU企业场景。
中游大概率会分成两条路:一条是低价开源做规模,一条是高价值闭源做ARPU。真正有定价权的,不是最便宜的那家,而是能把高能力、低时延、企业级交付装进同一份合同里的那家。
另外一个容易被低估的点,是中游正在成为价值制造厂,而不仅是价值过路费。AI云合同本身可能只有中等毛利率,但如果叠加数据库、多云、数据治理、企业软件接口、安全权限、工作流封装,整体价值会被继续放大。
这也是为什么中游未来的胜负手,不只是GPU堆得够不够快,而是调度、网络、数据库、模型路由、企业封装这些非芯片能力能不能形成持续复利。
换句话说,云厂商会越来越像Token的电网公司。它们既要建设基础设施,也要调度模型、分配算力、优化成本、保证稳定性,还要把复杂技术封装成企业愿意购买的服务。
Agent把Token需求改写成任务复杂度税
如果说过去两年AI最重要的变化是什么,我的答案不是模型更聪明,而是调用方式变了。
传统聊天式调用,Token消耗大体跟问题次数线性相关;Agent不同,它把一次调用扩成了一条任务链。一次复杂任务可能要经历拆解、检索、调用工具、执行、校验、修正,每一步都会把新的内容写回上下文,继续喂给模型。
这样一来,决定成本的就不再是一问一答,而是任务有多长、多复杂、要不要反复试错。
这不是抽象推演,数据已经很明显。2025年内,推理模型Token占比从几乎可以忽略,升到年底超过50%;平均Prompt长度从约1.5K提升到6K以上,平均序列长度从不到2000token升到5400token以上。国内侧也出现了类似加速,到2026年3月,国内日均Token调用量已经超过140万亿,相比2024年初增长1400倍。
更扎实的证据来自Agenticcoding。最新研究分析了SWE-benchVerified上的八个前沿模型轨迹,结论非常直接:Agent式编码任务的Token消耗,最高可以比普通代码聊天和推理高出三个数量级;同一个任务不同运行之间的总Token消耗,差异可达30倍,而且更贵并不自动意味着更高成功率。
另一篇多Agent软件工程研究也发现,自动化代码审查和反复修正阶段,占走了平均59.4%的Token,输入Token始终是成本大头。
这会直接改写商业模式。
传统SaaS最常见的是按席位收费,但Agent的成本波动太大。轻度用户和重度用户的推理成本可能完全不是一个量级。如果仍然只靠固定订阅,厂商很容易出现收入增长慢于推理成本增长的问题。
未来Agent产品不会回到单一席位定价,而会越来越像订阅保底、按量超额、按任务计价、结果分成的混合体。
Agent时代,最大的危险不是没人用,而是用得越多亏得越多。产品演示越复杂,越要算清楚背后的单任务成本。成本模型不闭环,爆款也可能变成利润黑洞。
下游真正会重估的是高ROI场景
我最不认同的一种说法,是AI应用全面开花,所以应用层会普涨。
现实不会这样简单。
真正值得重估的,不是有AI的应用,而是能把Token变成业务结果的应用。筛选框架可以很简单:综轴看Token消耗密度,横轴看场景ROI。越靠右上,越可能承接AI应用重估。
排在最前面的不是泛娱乐,也不是轻办公,而是编程/研发、工业AI/预测维护、金融风控/合规、企业办公/知识管理。核心原因很简单:这些场景任务价值高、错误成本高、流程复杂,客户愿意为成功率和可靠性付费。
代码开发对应工程师效率和交付速度;工业AI对应设备停机、良率改善和预测维护;金融风控合规对应错误成本、监管压力和审核效率;企业知识管理对应组织内部信息流、决策效率和流程自动化。客户不是为AI好玩付费,而是为降本、增收、控风险、提效率付费。
海外案例已经开始分化。
Palantir是最鲜明的例子。2026Q1收入同比增长85%至16.3亿美元,AIP相关收入占比提升到79%,同比增长104%,同时维持高毛利、高现金流和GAAP盈利。它的核心不是把AI做成一个插件,而是把AI变成企业决策和运营系统里的高价值能力。
ServiceNow也在走类似路线。使用NowAssist的高价值大客户数量同比增长130%,说明企业Agent并不是没有需求,而是正在从PoC往预算科目里走。
但Salesforce的例子提醒我们,AI应用商业化并不会自动兑现。Agentforce年化收入已经超过10亿美元,但最新CIO调查显示,真正付费使用其Agent工具的比例仍然偏低。市场对它能否把演示能力变成确定性业务,依然存在疑问。
这就是下游应用最残酷的地方:流量不是壁垒,功能不是壁垒,只有能让客户在财务上算得过账的结果,才是真正壁垒。
SaaS的分化:AI是增量,还是侵蚀
SaaS是这一轮AI应用重估里最值得看的方向,但它不会整体受益。
AI对SaaS有两种完全不同的影响:一种是增量,一种是侵蚀。
如果AI能带来更高ARPU、更强续费、更高客户粘性和新的付费模块,它就是增量;如果AI只是增加研发成本、推理成本和服务器成本,却没有带来明显付费提升,那就是侵蚀。
看起来产品更聪明了,利润率却更差了,这是很多SaaS公司接下来要面对的现实。
历史上的云化SaaS行情,对应过比较高的PS估值区间;而当前国内多数SaaS公司估值已经回落。接下来会不会修复,不取决于它有没有AI概念,而取决于AI能不能带来ARPU、续费、合同负债、收费模式和交付效率的实质改善。
放到国内映射上,我会这样看:
金山办公是工具型入口,优势是AI可以直接嵌进高频工作流,考核点不是故事,而是会员提价、AI付费渗透和ARPU。
同花顺是数据与流程锁定型入口,核心看AI是否强化交易、投研和金融数据生态粘性。
金蝶更像企业管理与知识工作流入口,价值在于ERP、CRM、知识管理和Agent结合,但落地周期会更长。
深信服则偏安全与基础设施入口,优势在于把AI塞进网络、安全、运维这些刚需场景。
它们的共同点不是都能重估,而是都必须回答同一个问题:AI是收入增量,还是利润侵蚀?
回答得清楚,估值才有修复空间;回答不清楚,就只是多了一层成本。
能源和液冷开始决定上游天花板
很多人还在用GPU数量理解上游,但我越来越觉得,上游的下一个关键变量不是芯片本身,而是电。
Token总成本中,电力和算力折旧合计占比接近70%到80%。这意味着AI基础设施扩张一旦越过芯片阶段,下一步必然锚定到电力获取、PUE、冷却效率和算电协同。
国内数据已经很直观。智能算力规模预计到2028年达到2781.9EFlops,2023到2028年复合增速约46.2%。到2030年,在高情景下,我国算力中心用电量可能超过7000亿千瓦时,占全社会用电量5.3%。
全球层面,数据中心耗电也在快速上升。到2030年,AI数据中心已经不再是互联网配套设施,而是在变成电力系统里的新型工业负荷。
液冷则把这个约束具体化。机柜功率密度上升、PUE标准收紧、面积受限、芯片高温故障率上升,使液冷从可选变成必选。国内液冷服务器市场规模预计2026年达到257亿元,渗透率达到37%,2027年超过50%,2030年达到82%。
这说明,上游未来比拼的,不只是拿到多少芯片,更是能不能以更低PUE、更高液冷渗透、更稳MW上线节奏,把Token生产出来。
如果说GPU是AI上半场的瓶颈,那么电力和液冷就是AI下半场的硬约束。Token工厂不是普通数据中心,它要求算、电、热、网一起优化。
AI产业链已经进入TokenROI定价阶段。
上游不是结束了,而是从高弹性走向兑现;中游不是只有故事,而是要证明智能密度、调度效率和资本回报;下游不是全面繁荣,而是只奖励那些能把Token烧成客户结果的场景。
Agent会把Token需求继续放大,但也会把商业模式从席位制推向按量、按任务、按结果的混合体;能源和液冷则会成为下一轮上游扩张最硬的约束。
我会用五个硬指标观察这条产业链:
看高价值Token的溢价,而不是只看模型均价。
看中游的上线MW、利用率与backlog兑现,而不是只看订单。
看下游的ARPU、续费、合同负债和现金流,而不是只看DAU。
看Agent的单任务成本和收费模型是否闭环。
看电力、PUE、液冷渗透率和园区交付,而不是只看芯片份额。
最终判断标签是:
上游仍强,但从弹性进入兑现;中游提效,核心看资本回报;下游重估,但分化会更残酷。AI下半场,真正值钱的不是消耗Token,而是把Token烧成客户愿意付费的结果。
本文内容整理自中国银河证券计算机行业策略、公司公开披露、学术研究及公开资料,数据与观点来源于上述资料,仅供参考,不构成任何投资建议。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


