【券商聚焦】伯恩斯坦指Z.ai文本编程推理利润优于MiniMax 归因定价与工作量结构

金吾财讯04-21 22:35

金吾财讯 | 伯恩斯坦于2026年4月21日发布研报,探讨中国互联网行业的AI推理经济性,并援引未覆盖公司MiniMax(00100)和Z.ai的财务数据进行说明。该机构对腾讯控股(00700)和阿里巴巴集团(BABA)控股维持“跑赢大市”评级,目标价分别为780港元和180美元。研报指出,AI推理利润是中长期竞争力的重要驱动力,其单位经济性受每token收入与成本共同影响。

研报分析显示,不同模态的token定价差异巨大,是影响推理利润的关键。经调整典型输入输出长度和KV缓存命中率后,Z.ai的混合每百万token收入约为1美元。视频生成收入略高,而MiniMax的文本/编程token定价约为0.2美元/百万token。最令人意外的是其文本转语音token的标价超过10美元/百万token,这主要源于更宽松的竞争环境和AI应用开发者的高支付意愿。

在核心的文本/编程推理利润方面,研报基于对GPU成本、token吞吐效率和工作量结构的估算,认为Z.ai应显著高于MiniMax。Z.ai在2025年下半年报告的API毛利率为22.4%,年同比增量利润率为30.3%。而MiniMax在2025年前九个月报告了69.4%的开放平台毛利率,但未披露全年数据。展望2026年上半年,Z.ai的GLM-5及GLM-5.1模型发布及相应涨价,应能抵消超大规模云服务商的提价影响,从而推动利润率改善。而MiniMax因定位为低成本智能体模型而维持价格不变,且其工作负载正从高利润的音频API向利润率较低的文本/编程和智能体工具使用倾斜,这可能对其混合平均每token收入构成压力。

此外,研报提及,依托阿里云的Qwen(通义千问)策略旨在覆盖尽可能多的模态以捕获广泛算力需求。由于超大规模云服务商利润率是独立AI实验室每token成本的重要输入,Qwen应能在中期内持续享有相对于独立实验室的成本优势。行业整体风险在于,随着AI工作负载从高利润的音频等模态转向利润率更低的文本/编程和智能体任务,可能导致部分AI实验室的混合利润率面临下行压力。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法