争夺Token“榜一大哥”:用算力烧出的,是实力还是焦虑

南方都市报05-09 15:31

  自暮春入夏,争当“Token榜一大哥”已萦绕在每一位开发者的心头。近日,童话巨头迪士尼悄然在内网上线数据看板,实时公示全员Token消耗数据。有员工仅9个工作日,就累计调用了美国人工智能公司Anthropic旗下Claude模型约46万次,折算下来平均每1.7秒便调用一次。

  视线跳出梦幻迪士尼,一场疯狂比拼Token消耗的风潮正席卷中美科技圈。在硅谷,Token已然成为各大科技企业追逐的焦点,甚至衍生出 Tokenmaxxing的潮流。随着AI深入融入日常办公,越来越多的科技公司将AI使用情况纳入绩效考核,而 Token 消耗量,正是核心衡量标尺。

  英伟达CEO黄仁勋近期直言,为“Token消耗不足的工程师”倍感忧虑;美国创业孵化器Y Combinator首席执行官Garry Tan也坦言,该公司“比大多数人更早入局Tokenmaxxing风潮”。

  放眼国内,电信运营商、互联网大厂、AI模型与芯片企业纷纷入局,不遗余力、高调地披露Token消耗数据、打造Token新概念。Token俨然成了科技圈新的时尚单品,仿佛无Token便寸步难行。

  对此,有开发者向南都N视频记者直言:Token消耗量代表与AI的交互深度及强度,更折射个人的创意活跃度。快速高频迭代试错,或许会产出100款“垃圾(不成熟方案)”,但总有可能打磨出一款好的产品!这也是众人争抢“Token榜一大哥”的底层逻辑。

  争夺Token“榜一大哥”

  身为初创公司OneOneTalk的联合创始人兼CTO,彭超所在的公司同样会每日统计Token消耗量。当被问及自己是否为公司的“Token 榜一大哥”时,他的回答显得并不笃定,只是淡淡表示“目前是的”。言下之意,他在公司的榜首位置并非牢不可破,随时都有可能被其他人赶超。

  据彭超介绍,该公司的全职小伙伴中,每人手里都有1-2个项目在运行,人均每天“烧掉”的Token大约有2个亿。他向南都记者算了一笔成本账,以团队常用模型和缓存使用场景为例,换算成API的价格,10亿Token在订阅套餐(如coding plan)内的等效成本约在800美元左右;如果采用纯API按量付费、无缓存优化,则成本大约在1400美元到1800美元之间。综合折算下来,员工人均每日烧掉的Token成本,大约在160美元至360美元之间。

  面对如此高昂的Token消耗成本,使用者究竟要交出怎样的成果,才能让管理者认可其投入价值?在这一点上,彭超认为,很难量化评判。他表示,“不少小伙伴刚从古法编程转向AI编程,本身就需要一段适应磨合的过程;即便已经熟练上手,后续也仍会面临各类新的问题和挑战。”

  比如业内戏称的“修改地狱”。彭超介绍,开发者与AI反复对话、不断进行意图对齐后,AI对沟通意图的理解会越来越模糊,这时就会陷入“修改地狱”:无论如何调整指令,AI都拧不回来,无法回归需求初衷,最终往往只能推倒全过程重来。

  他还提到,即便用户跨过了“上手期”、避开了“修改地狱”,使用AI创作仍会遇到AI审美不足的问题。这类场景下,Token在无形中如流水般消耗,但实际产出成效却不一定能匹配消耗的成本。

  尽管有上述种种问题,但彭超依然是坚定的Tokenmaxxing的“弄潮儿”。在硅谷,Tokenmaxxing 泛指一种最大化自己的Token使用量,竞相成为Token榜一大哥的趋势。

  据公开报道,目前Meta与OpenAI等公司已就此设有相关排行榜。比如在Meta内部就曾出现一个Token消耗量统计工具,首次应用就展现了Token对金钱的超级“燃烧力”:30天内,Meta全员“烧掉”了60万亿Token——按Claude公开的API价格折算,大约有90亿美元。

  除了这两家公司,越来越多的大型科技公司正在将AI使用情况纳入绩效评估体系。黄仁勋更是直接为Tokenmaxxing“站台”,他公开表示,“如果一个年薪50万美元的工程师,没在AI工具上烧掉25万美元的Token,我会深感不安。”

  成为Token榜一大哥,到底意味着什么?彭超在接受南都记者采访时表示:“Token消耗在当下有着特殊的意义。尽管Token消耗量高并不等同于产出价值高,但却能直观体现一个人的创意活跃度——它代表着你在与AI进行高频深度互动,这意味着你在短时间内完成了尽可能多的高密度快速迭代。在这个过程中,或许会产出100个‘垃圾(不成熟的方案)’,但经过百次试错迭代后,成功的概率会呈指数级提升,理想状态下,总能打磨出一款优质产品。”

  出现“邪修”做无用功刷榜

  AI 知识博主 Berryxia.AI 则持不同观点。尽管他每月在Token上消耗的成本也高达数百美元,但他并不认同盲目推崇的“唯 Token 论”。他认为,“Token消耗量只能反映人与AI的交互频率。从企业管理者的角度出发,鼓励员工消耗Token,初衷是为了推动大家主动用好AI,但Token消耗的多少,与最终能否产出优质产品,两者之间并没有必然联系。”

  另一个维度的问题是,不同的人消耗Token,产出的结果也大相径庭。“比如我对AI比较熟悉,了解提示词工程,可以很快地用半小时与AI对话,完成一个项目。但有些同事可能不擅长提示词工程,花半天时间做出来的成果,质量可能并不理想。”

  在他看来,短期内大家大量消耗Token并非不可行,但关键在于,Token消耗毕竟涉及成本问题,最终能否算得过来这笔账才更为重要。“用了和用得好是两回事,烧掉Token还是要看做出了什么成果,毕竟最终还是要看回报率以及是否产生了正向反馈。Token衡量的只是投入,并不是结果。”

  Berryxia.AI认为,想要成为所谓的Token榜一大哥,“邪修”们有几百万种办法。“任何规则制定后都会有人钻空子,比如,可以做一些消耗Token的工作,加载一个上下文很长的小说文本、生成图片和视频,但这并非用AI从事真正有意义的工作。”

  这类Token消耗的漏洞,正在被逐渐发现。比如,上述Meta的Token消耗量榜单很快被下线。Meta方面表示,公司不主张将个人Token数据作为评估绩效的主要方式。

  据悉,在排行榜下线前,Meta全公司30天内的Token总消耗量已从6.02万亿攀升至73.7万亿。部分员工为了冲榜,采取了各种手段,比如设计更长的提示词、运行多个AI代理,甚至部署会议转录机器人等。

  几时从“消耗量”转向“成果”

  业界热议Token消耗量能否等同于实际价值,这股热潮背后,实则折射出行业对Token消耗高成本的普遍焦虑。由此也引出了核心命题:我们能否以更低成本完成同等工作?或是在同等成本投入下,创造更多价值、完成更多任务?

  在Tokenmaxxing席卷业界的同时,近期deepseek发布了全新系列模型V4。发布后DeepSeek还开启了连续降价,再次将成本和性价比打到极致。4月25日晚,DeepSeek宣布对V4-Pro模型API开启限时2.5折价格优惠。26日晚,DeepSeek又宣布DeepSeek全系列API服务,输入缓存命中的价格降至原有价格的1/10。其中,Pro模型在2026年6月1日前叠加2.5折限时优惠。最新调价后,DeepSeek-V4-Flash每百万Tokens输入缓存命中价格为0.02元,DeepSeek-V4-Pro为0.025元。这意味着,DeepSeek-V4-Pro输入缓存命中价格为原价的四十分之一。

  彭超告诉南都记者,DeepSeek 的一大创新在于,它采用了混合压缩注意力机制,在处理超长上下文时能够更高效地组织和检索信息,相较上一代模型只需约27%的计算量和 10%的缓存空间,这意味着同样的任务消耗的Token和算力都更少。我们经常做编程任务,你会非常明显地感觉到,用海外的模型可能15分钟100美元就没了,但我用 DeepSeek-V4写代码,可能过了5小时,才掉了10块钱人民币。"

  最直观的是,据他粗略估算,同样的编码过程DeepSeek可能需要消耗100多元人民币,但如果换成海外顶级大模型,达到相应的效果可能需要1000美元至2000美元。

  成本被打下来后,应用效果如何?Berryxia.AI认为,DeepSeek-V4 flash将成本打到了极致,“整体性价比能打到70-80分,应对日常不是特别复杂的长任务,基本上多轮对话都能达到一个不错的效果。”

  Token消耗量从来不是目的,完成任务才是。Tokenmaxxing的热潮带来了Token成本的新思考。但不少业内人士都认为,未来Token的单价会越来越低。当Token成本不再让人焦虑时,也许可以停止讨论消耗量,开始真正讨论生产力了。

(文章来源:南方都市报)

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法