争夺Token“榜一大哥”：用算力烧出的，是实力还是焦虑_老虎社区_美港股上老虎

争夺Token“榜一大哥”：用算力烧出的，是实力还是焦虑

南方都市报05-09 15:31

　　自暮春入夏，争当“Token榜一大哥”已萦绕在每一位开发者的心头。近日，童话巨头迪士尼悄然在内网上线数据看板，实时公示全员Token消耗数据。有员工仅9个工作日，就累计调用了美国人工智能公司Anthropic旗下Claude模型约46万次，折算下来平均每1.7秒便调用一次。

　　视线跳出梦幻迪士尼，一场疯狂比拼Token消耗的风潮正席卷中美科技圈。在硅谷，Token已然成为各大科技企业追逐的焦点，甚至衍生出 Tokenmaxxing的潮流。随着AI深入融入日常办公，越来越多的科技公司将AI使用情况纳入绩效考核，而 Token 消耗量，正是核心衡量标尺。

　　英伟达CEO黄仁勋近期直言，为“Token消耗不足的工程师”倍感忧虑；美国创业孵化器Y Combinator首席执行官Garry Tan也坦言，该公司“比大多数人更早入局Tokenmaxxing风潮”。

　　放眼国内，电信运营商、互联网大厂、AI模型与芯片企业纷纷入局，不遗余力、高调地披露Token消耗数据、打造Token新概念。Token俨然成了科技圈新的时尚单品，仿佛无Token便寸步难行。

　　对此，有开发者向南都N视频记者直言：Token消耗量代表与AI的交互深度及强度，更折射个人的创意活跃度。快速高频迭代试错，或许会产出100款“垃圾（不成熟方案）”，但总有可能打磨出一款好的产品！这也是众人争抢“Token榜一大哥”的底层逻辑。

　　争夺Token“榜一大哥”

　　身为初创公司OneOneTalk的联合创始人兼CTO，彭超所在的公司同样会每日统计Token消耗量。当被问及自己是否为公司的“Token 榜一大哥”时，他的回答显得并不笃定，只是淡淡表示“目前是的”。言下之意，他在公司的榜首位置并非牢不可破，随时都有可能被其他人赶超。

　　据彭超介绍，该公司的全职小伙伴中，每人手里都有1-2个项目在运行，人均每天“烧掉”的Token大约有2个亿。他向南都记者算了一笔成本账，以团队常用模型和缓存使用场景为例，换算成API的价格，10亿Token在订阅套餐（如coding plan）内的等效成本约在800美元左右；如果采用纯API按量付费、无缓存优化，则成本大约在1400美元到1800美元之间。综合折算下来，员工人均每日烧掉的Token成本，大约在160美元至360美元之间。

　　面对如此高昂的Token消耗成本，使用者究竟要交出怎样的成果，才能让管理者认可其投入价值？在这一点上，彭超认为，很难量化评判。他表示，“不少小伙伴刚从古法编程转向AI编程，本身就需要一段适应磨合的过程；即便已经熟练上手，后续也仍会面临各类新的问题和挑战。”

　　比如业内戏称的“修改地狱”。彭超介绍，开发者与AI反复对话、不断进行意图对齐后，AI对沟通意图的理解会越来越模糊，这时就会陷入“修改地狱”：无论如何调整指令，AI都拧不回来，无法回归需求初衷，最终往往只能推倒全过程重来。

　　他还提到，即便用户跨过了“上手期”、避开了“修改地狱”，使用AI创作仍会遇到AI审美不足的问题。这类场景下，Token在无形中如流水般消耗，但实际产出成效却不一定能匹配消耗的成本。

　　尽管有上述种种问题，但彭超依然是坚定的Tokenmaxxing的“弄潮儿”。在硅谷，Tokenmaxxing 泛指一种最大化自己的Token使用量，竞相成为Token榜一大哥的趋势。

　　据公开报道，目前Meta与OpenAI等公司已就此设有相关排行榜。比如在Meta内部就曾出现一个Token消耗量统计工具，首次应用就展现了Token对金钱的超级“燃烧力”：30天内，Meta全员“烧掉”了60万亿Token——按Claude公开的API价格折算，大约有90亿美元。

　　除了这两家公司，越来越多的大型科技公司正在将AI使用情况纳入绩效评估体系。黄仁勋更是直接为Tokenmaxxing“站台”，他公开表示，“如果一个年薪50万美元的工程师，没在AI工具上烧掉25万美元的Token，我会深感不安。”

　　成为Token榜一大哥，到底意味着什么？彭超在接受南都记者采访时表示：“Token消耗在当下有着特殊的意义。尽管Token消耗量高并不等同于产出价值高，但却能直观体现一个人的创意活跃度——它代表着你在与AI进行高频深度互动，这意味着你在短时间内完成了尽可能多的高密度快速迭代。在这个过程中，或许会产出100个‘垃圾（不成熟的方案）’，但经过百次试错迭代后，成功的概率会呈指数级提升，理想状态下，总能打磨出一款优质产品。”

　　出现“邪修”做无用功刷榜

　　AI 知识博主 Berryxia.AI 则持不同观点。尽管他每月在Token上消耗的成本也高达数百美元，但他并不认同盲目推崇的“唯 Token 论”。他认为，“Token消耗量只能反映人与AI的交互频率。从企业管理者的角度出发，鼓励员工消耗Token，初衷是为了推动大家主动用好AI，但Token消耗的多少，与最终能否产出优质产品，两者之间并没有必然联系。”

　　另一个维度的问题是，不同的人消耗Token，产出的结果也大相径庭。“比如我对AI比较熟悉，了解提示词工程，可以很快地用半小时与AI对话，完成一个项目。但有些同事可能不擅长提示词工程，花半天时间做出来的成果，质量可能并不理想。”

　　在他看来，短期内大家大量消耗Token并非不可行，但关键在于，Token消耗毕竟涉及成本问题，最终能否算得过来这笔账才更为重要。“用了和用得好是两回事，烧掉Token还是要看做出了什么成果，毕竟最终还是要看回报率以及是否产生了正向反馈。Token衡量的只是投入，并不是结果。”

　　Berryxia.AI认为，想要成为所谓的Token榜一大哥，“邪修”们有几百万种办法。“任何规则制定后都会有人钻空子，比如，可以做一些消耗Token的工作，加载一个上下文很长的小说文本、生成图片和视频，但这并非用AI从事真正有意义的工作。”

　　这类Token消耗的漏洞，正在被逐渐发现。比如，上述Meta的Token消耗量榜单很快被下线。Meta方面表示，公司不主张将个人Token数据作为评估绩效的主要方式。

　　据悉，在排行榜下线前，Meta全公司30天内的Token总消耗量已从6.02万亿攀升至73.7万亿。部分员工为了冲榜，采取了各种手段，比如设计更长的提示词、运行多个AI代理，甚至部署会议转录机器人等。

　　几时从“消耗量”转向“成果”

　　业界热议Token消耗量能否等同于实际价值，这股热潮背后，实则折射出行业对Token消耗高成本的普遍焦虑。由此也引出了核心命题：我们能否以更低成本完成同等工作？或是在同等成本投入下，创造更多价值、完成更多任务？

　　在Tokenmaxxing席卷业界的同时，近期deepseek发布了全新系列模型V4。发布后DeepSeek还开启了连续降价，再次将成本和性价比打到极致。4月25日晚，DeepSeek宣布对V4-Pro模型API开启限时2.5折价格优惠。26日晚，DeepSeek又宣布DeepSeek全系列API服务，输入缓存命中的价格降至原有价格的1/10。其中，Pro模型在2026年6月1日前叠加2.5折限时优惠。最新调价后，DeepSeek-V4-Flash每百万Tokens输入缓存命中价格为0.02元，DeepSeek-V4-Pro为0.025元。这意味着，DeepSeek-V4-Pro输入缓存命中价格为原价的四十分之一。

　　彭超告诉南都记者，DeepSeek 的一大创新在于，它采用了混合压缩注意力机制，在处理超长上下文时能够更高效地组织和检索信息，相较上一代模型只需约27%的计算量和 10%的缓存空间，这意味着同样的任务消耗的Token和算力都更少。我们经常做编程任务，你会非常明显地感觉到，用海外的模型可能15分钟100美元就没了，但我用 DeepSeek-V4写代码，可能过了5小时，才掉了10块钱人民币。"

　　最直观的是，据他粗略估算，同样的编码过程DeepSeek可能需要消耗100多元人民币，但如果换成海外顶级大模型，达到相应的效果可能需要1000美元至2000美元。

　　成本被打下来后，应用效果如何？Berryxia.AI认为，DeepSeek-V4 flash将成本打到了极致，“整体性价比能打到70-80分，应对日常不是特别复杂的长任务，基本上多轮对话都能达到一个不错的效果。”

　　Token消耗量从来不是目的，完成任务才是。Tokenmaxxing的热潮带来了Token成本的新思考。但不少业内人士都认为，未来Token的单价会越来越低。当Token成本不再让人焦虑时，也许可以停止讨论消耗量，开始真正讨论生产力了。

（文章来源：南方都市报）

免责声明：本文观点仅代表作者个人观点，不构成本平台的投资建议，本平台不对文章信息准确性、完整性和及时性做出任何保证，亦不对因使用或信赖文章信息引发的任何损失承担责任。

争夺Token“榜一大哥”：用算力烧出的，是实力还是焦虑

精彩评论