按头让员工猛猛用AI的硅谷巨头,开始“玩不起”了。
亚马逊苦口婆心地说“不要为了用AI而用AI”,大手一挥关闭了内部的员工token消耗排行榜。
微软突然取消大部分Claude Code授权,要求开发者将工作流程迁回GitHub Copilot CLI。
不久前,情况还完全不是这样。AI用得越多,似乎就代表员工越先进,公司越有未来。
但当员工真的开始狂用AI,企业很快发现,自己有没有逼出来更高生产力还未可知,账单先膨胀了。
一边开始为Token账单头疼,一边又怕自己在AI竞赛里落后。硅谷正在面对一个自己亲手制造的难题。
伙计们,AI实在是太好用啦!
一切要从去年说起,虽然“鼓励员工拥抱AI”的现象早已有之,但2025年突然变成了不由分说的浪潮。
最明显的,就是硅谷大厂带头按头员工多用AI。
用微软开发者工具业务的高管潘正磊(Julia Liuson)的话说就是:“使用AI已经不再是可选项,而是每个职位、每个层级的核心能力。”
彼时她在内部邮件中要求管理者,在评估员工表现时考虑其使用内部AI工具的情况,其中包括GitHub Copilot。
亚马逊则一边表示未来部分岗位可能因AI而减少,一边告诉员工应对方式是“拥抱AI”。
去年夏天,CEO安迪·贾西(Andy Jassy)向全体员工发送了一封关于生成式AI的邮件。他在邮件中表示,随着公司大规模部署生成式AI和智能体,部分现有岗位需要的人会减少;在未来几年里,AI带来的效率提升预计会减少亚马逊的企业员工总数。
在谈到员工应当如何应对时,贾西直接要求员工主动拥抱AI:
“了解AI,参加研讨会和培训,尽可能使用和试验AI,参与团队头脑风暴,思考如何更快、更大范围地为客户创新,以及如何用更精简的团队完成更多工作。”
这段话可以视为亚马逊内部AI动员的公开起点。
不仅是几家巨头,在2025年,高调“全员AI”几乎是某种时尚。
Shopify提出“反射式使用AI”的概念,表示这现在是公司的基础要求。所谓“反射式使用”,意思是“像条件反射一样用AI”。员工遇到任务时,首先应该想到能否借助AI完成。
公司还要求,团队在申请增加人手和资源之前,必须先回答一个问题:为什么这项工作不能由AI完成?
多邻国更是公开表示公司将转向“AI优先”。能用AI的,不用外包。能用AI的,不招新人。在员工评价中,也会考察其使用AI的情况。
这种趋势,一定程度上也延宕到今年。
今年3月,黄仁勋公开表示假如英伟达年薪50万美元的工程师一年没有消耗至少25万美元的AI Token,自己会感到“非常担忧”。当被问到英伟达是否准备每年为工程团队花费约20亿美元购买Token时,黄仁勋的回答是:“我们正在努力。”
这已经不是他第一次表态,去年底,在英伟达内部举行的一次全员大会上,黄仁勋质问曾建议团队“少用AI”的高管“你们疯了吗”,并明确要求员工尽可能用AI自动化所有可以自动化的任务,同时向员工保证AI不会夺走他们的饭碗。
但要说哪家公司最激进,Meta当仁不让。
2025年11月,Meta首席人力官贾内尔·盖尔(Janelle Gale)宣布,从2026年起,“AI驱动的影响力”将成为员工的核心期待,正式进入绩效评价。
到了2026年4月,Meta内部又出现了一块名为“Claudeonomics”的排行榜:它追踪超过8.5万名员工消耗的Token数量,列出前250名,并授予“Token传说”“缓存大师”等称号。短短30天内,榜单记录的Token消耗量超过60万亿个。
AI使用变成了一场相互厮杀的内部游戏。
BCG在《AI Radar 2026》报告中调查了2360名企业高管,其中包括640名CEO。结果显示,94%的组织表示,即使AI投资在2026年无法立即带来回报,它们也会继续投入。
报告预计,企业用于AI的投入占营收比例,将从2025年的约0.8%提高至2026年的约1.7%,几乎翻倍。72%的CEO表示,自己已经是公司AI决策的主要负责人;一半CEO甚至认为,如果AI投入无法取得成效,自己的职位都会受到影响。
对这些公司来说,AI成为CEO亲自下注的一场转型,重要的是不能显得自己比同行慢一步。
是不是玩不起?硅谷巨头带头反悔
然而,这场AI使用大赛还没热闹多久,硅谷巨头们就开始踩刹车了。
最先打自己脸的,正是此前要求员工“尽可能使用和试验AI”的亚马逊。
今年5月底,亚马逊被曝关闭了一项名为“KiroRank”的内部排行榜。这个由员工自行制作的榜单,用来显示员工使用AI工具时消耗的Token数量。
据《金融时报》报道,一些员工开始使用亚马逊内部AI智能体平台MeshClaw运行非必要任务,以提高自己的AI使用数据。MeshClaw原本可以代替员工发起代码部署、分拣邮件,或与Slack等应用交互;但当Token消耗被放进排行榜,员工运行这些智能体的目的,就可能从完成真正需要的工作,变成单纯“刷榜”。
这种行为甚至有了一个专门的名字:Tokenmaxxing,意思就是尽可能刷高Token消耗量。
虽然亚马逊没有披露员工究竟运行了哪些无效任务,但在相关社区讨论中,有用户已经直接设想过这种“冲榜”方式:
把MeshClaw挂在后台,让它持续对源代码包进行静态分析,Token自然会不断累积。
Hacker News上还有用户称,自己认识的员工在公司开始考核“花掉多少Token”后,干脆让不同AI智能体互相接收对方输出、循环运行,因为真正需要大量Token的工作根本没有那么多。
亚马逊最后不得不叫停这场比赛。
公司高级副总裁戴夫·特雷德韦尔(Dave Treadwell)在内部提醒员工:“请不要为了使用AI而使用AI。使用AI,是为了帮助你解决客户问题、解决业务问题、实现创新。”
这距离贾西亲自鼓动员工“拥抱AI”还不到一年。
亚马逊不是唯一一个开始收手的巨头。今年5月中旬,微软开始取消内部大部分Claude Code许可证。
巨头之下,中小公司也撑不住了。
去年4月,多邻国CEO路易斯·冯·安(Luis von Ahn)还宣布公司转向“AI优先”,但一年后,他承认公司已经撤回了这项考核标准。
整整一年后,他在播客中表示,员工曾经向公司提出质疑:是不是为了显得公司足够“AI优先”,大家就必须为了使用AI而使用AI?
最终,多邻国不再将员工是否使用AI作为正式绩效指标。冯·安表示,真正重要的是员工能不能把工作做好。AI适合某些任务,但并不适合所有任务,公司也不应该强迫员工在不适合的地方硬用AI。
曾经迫不及待让员工“拥抱AI”的公司当然没有放弃AI。
它们只是终于发现员工不用AI是一个问题,但员工为了排名、绩效和自保而狂烧Token,可能是另一个更“贵”的麻烦。
AI虽好,贪不起杯啊
“造AI”很烧钱,这个大家都知道了。
但是“用AI”也这么烧钱,还真有点意外。
一个典型是Uber,今年4月就花光了全年的AI预算。遥想去年12月,Uber向约5000名工程师开放了Anthropic旗下的AI编程工具Claude Code。
前文提到今年5月微软开始取消内部大部分Claude Code许可证,微软对内解释称,这是为了将工具链统一到自家的Copilot CLI。
但据The Verge报道,这同时也是一项财务决定。
Claude Code授权将在6月底,也就是微软当前财年结束前被大规模关闭,以便在新财年开始前削减一部分运营成本。
而更值得注意的是,在微软推动员工迁回Copilot CLI之际,Copilot本身的收费方式也正在改变。
今年4月,GitHub宣布,从6月1日起,面向企业和团队用户的GitHub Copilot付费方案将转向基于使用量的计费模式。过去,这些客户主要按照订阅套餐和高级请求次数付费;新方案下,每个套餐只包含一定额度的GitHub AI Credits,超出额度后需要按照实际使用量继续付费。
这笔费用怎么算?按照员工使用过程中消耗的输入Token、输出Token和缓存Token计算。
GitHub在官方公告中表示,随着Copilot开始承担分析、修改和迭代等更复杂的智能体任务,不同任务的算力消耗差异越来越大,因此需要改用按实际使用量计费。
Anthropic也采取了类似的计费逻辑。
目前,Claude企业版的座席费只覆盖平台访问权限,并不包含实际使用量。员工使用Claude、Claude Code和Cowork时产生的每一个Token,都要按照标准API价格另外计费。
更直接的是,Anthropic官方帮助文档明确提醒企业:在新的按使用量计费方案下,团队没有单独分配好的Token额度。一名员工大量使用AI,并不会减少其他员工可用的额度,只会让组织最终收到的账单更高。旧的固定座席方案,也将在续约时逐步转入这种按使用量计费的模式。
OpenAI的动作稍有不同。它没有宣布将所有企业方案统一改为按Token收费,但在今年4月,为ChatGPT Business和Enterprise团队推出了Codex按量付费选项:企业可以不用支付固定座席费,而是根据实际使用量为Codex付费。
与此同时,更强模型的调用成本也明显更高。
今年4月进入API的GPT-5.5,调用成本相比GPT-5.4进一步提高,在标准API价格下,其输入和输出Token单价均达到后者的两倍。
当公司要求员工“尽可能使用AI”,AI厂商却把费用精确挂到每一次调用和每一个Token上,事情就开始变得微妙了。
问题还不只是AI贵。
更直击灵魂的叩问是,当“全司AI向前冲”,效果究竟好吗?
早就有人看出其中的逻辑漏洞:让工程师以Token消耗量论英雄,和以谁花钱更多来给营销团队成员打分有什么区别?
全行业都已经在使用AI,但真正能把这种使用转化成利润的企业,目前仍然只是少数。
麦肯锡在《2025年AI现状》报告中调查了1993名企业受访者。结果显示,只有39%的受访者表示,AI已经对整个企业层面的息税前利润,也就是EBIT,产生了影响。
麦肯锡还专门定义了一类“AI高绩效企业”:既认为AI已经为公司创造显著价值,又认为AI对企业EBIT的贡献达到至少5%。符合这两个条件的企业,只占全部受访者的约6%。
此外,去年7月,研究机构METR公布了一项随机对照实验。16名有经验的开源软件开发者,在自己熟悉的代码库中完成246项真实任务,其中一部分任务允许使用AI工具,另一部分则不能使用AI。
在实验开始前,开发者预计,AI可以让他们完成任务的时间缩短24%。
实验结束后,即便已经亲自使用过这些工具,他们仍然认为AI让自己的工作速度提高了20%。
但实际结果完全相反:使用AI后,这些开发者完成任务所需的时间,反而增加了19%。
这项研究针对的是熟悉大型开源代码库的资深开发者,当然不能直接证明AI编程对所有人、所有任务都没有帮助。
但它至少说明了员工感觉自己在用AI提效,不等于效率真的提高了。公司看到AI使用量增长,也不等于公司真的获得了与之匹配的产出。
Token消耗变成绩效考核标准和“觉悟检测器”的时候,闹剧的基调就已经被定下了。AI当然不会因此退潮。但把Token消耗速率当成转型进度、把“多用AI”当成绩效答案的阶段,可能已经快结束了。
可喜可贺。
精彩评论