最近,全球著名咨询公司埃森哲的一段内部录音被媒体曝光。
录音里,埃森哲负责智能体AI战略的贾斯蒂斯·郭,正在跟同事讨论一个很现实的问题:员工用AI用得太猛,公司账单有点兜不住了。
这个问题其实很常见。毕竟这年头,能把AI用出这么大消耗量的公司,隐隐就站在鄙视链的最高层了。
但录音最扎眼的地方是,Token消耗的大头,并不是我们以为的工程师写代码,而是一群非技术员工在干一件特别朴素、也特别常见的事:把PDF转成PPT。
埃森哲客户组负责人斯图尔特·亨德森都笑了,他说自己也是最近才知道,PDF转Markdown竟然也是Token消耗大户。
你看,就这么一个听起来最像办公行政杂活的任务,突然变成了一家跨国公司AI预算里的烧钱大户。这事刚一听有点离谱,但仔细一想,一点都不奇怪。
01 先鼓励用,再发现失控
2025年9月,埃森哲CEO朱莉·斯威特宣布了一项8.65亿美元的重组计划,核心是把公司的人才和运营资源转向数字化AI服务。
她当时说得很硬气:无法重新培训的员工将被迅速淘汰;高级员工的AI使用情况,也会跟绩效考核和晋升挂钩。
其实这就已经能预见到现在的情况了。老大既然这么说,员工会怎么做?
很简单,能用AI的地方都用AI。PDF转PPT,让AI来。文档改格式,让AI来。最理性的选择当然是多用一点,至少别在跟同事的比拼中掉队。
于是,前几个月公司高层发愁的是“怎么让大家赶紧用AI”;几个月后,内部会议讨论的就变成了“怎么把AI用量管住”。高管们都在追问同一个问题:我们在AI上花的钱,到底有没有产生相应的价值?
这才是很多正在转型的公司碰到的尴尬:先把AI使用量,比如Token消耗量,变成绩效信号,再发现大家真的开始刷使用量。
这就好像给每个员工都发了一辆车,先鼓励所有人大力踩油门,油烧完了才收到天价账单,然后又开始按每一脚油门单独收费。
02 不只是埃森哲的问题
埃森哲不是孤例。Uber今年前四个月就把全年AI预算烧光了,只好对部分AI编码工具设置每人每月约1500美元上限。
亚马逊有员工搭了一个内部排行榜,叫Kirorank,专门追踪同事消耗了多少Token——结果大家开始疯狂刷榜,最后亚马逊把排行榜删了,副总裁还出来提醒员工:不要为了用AI而用AI。
Meta那边更夸张,有员工自己搭了一个内部排行榜Claudeonomic,追踪8.5万名同事的Token消耗。榜一大哥30天烧掉2810亿Token,折合至少数百万美元。
这些案例放在一起看,就不是某家公司管理粗糙了,而是一类组织病:先鼓励大家多用,再把用量摆上台面,再把排行榜、晋升、绩效这些东西接上去,最后发现成本失控,赶紧踩刹车。
03 古德哈特定律与苏联钉子
这事为什么眼熟?因为这种事可不是AI时代才有的。它其实是一个古老的管理陷阱,又一次被触发了。
这个陷阱有个名字,叫“古德哈特定律”。内容简单好理解:当一个指标变成目标,它就不再是一个好指标。
这话听起来有点拗口,我跟你解释下就明白了。
英国经济学家查尔斯·古德哈特最早提出这个观察的时候,说的是货币政策。也就是央行一旦盯住某个货币指标来调控经济,这个指标就会开始失真。
但这个规律后来被发现放到哪里都成立,比如企业管理、医疗、教育、军事,都不例外。
你拿代码行数考核程序员,程序员就能把5行代码写成50行。你拿Token消耗量考核员工AI使用情况,员工就能把一个PDF转PPT的活儿烧出天价。
得到上还有本书叫《指标陷阱》,里面有一个经典案例“苏联的钉子厂”:按重量考核,工人就造超大的钉子;按数量考核,工人就造细得像针的废品。
每个时代都有自己的“苏联钉子”,AI时代的这个钉子,可能就叫Token消耗量。
当然,麻烦的还不仅仅是指标,AI工具的计费方式也在变。以前很多工具像自助餐,包月之后随便用;现在越来越多工具按Token计费,设使用额度,每一道菜都单独算钱。Token账单会怎么变?
可很多公司的管理方式还停留在自助餐时代,领导还在喊“多吃多吃”,KPI还在鼓励“谁吃得多谁先进”。
你用自助餐的吃法,进了一家单点餐厅,预算肯定会炸。
04 马拉汽车的隐喻
我今年特别喜欢一张历史照片,在很多地方都提到过它,甚至把它打印了出来。
黑白照片里,一匹马套在一辆早期汽车前面,车身上印着U.S. MAIL。照片出自楠塔基特历史协会。我觉得它恰好说明了刚才说的指标异化:规则没跟上技术。
▲ 马拉汽车历史照片说实话,我第一次看到它的时候,还以为是AI做出来的,后来发现这是一张真实照片。
1910年代,美国马萨诸塞州的楠塔基特岛,是当时全美唯一成功禁止汽车的地方。岛上有一位邮递员叫克林顿·福尔杰,他要把邮件从镇上送到岛的另一端,但汽车不能在路上开。
于是他想了个办法:先牵出一匹马,把马套在汽车前面,拉着汽车走过禁行路段;等到了郊外没人管的地方,再把马卸掉,自己开车继续送信。
后来这种东西就叫“马拉汽车”(Horsemobile)。你看着会觉得荒诞,但又特别合理。车已经来了,规则还没变,所以马不能撤。
我经常在做决策的时候看着这张照片,想一件事:这个项目里,有哪些规则或者流程,是汽车前面的那匹马?是不是正因为这匹马还套在前面,AI才无法真正踩油门?
今天很多公司的AI转型,就是这个状态:工具已经是汽车了,考核还是马。你考核什么,员工就优化什么。技术变了,组织惯性没变,马还是那匹马。
举个例子,如果你想要在Token消耗排行榜上排第一太简单了。你拿《凡人修仙传》,先让AI把这部小说翻译成英文,再让AI把它变成分镜头脚本,最后把这些分镜头用可灵生成AI视频。
别说在Token排行榜上名列前茅了,你甚至可能让你们老板直接破产。
更麻烦的是,在很多公司里,这件事正在制度化。Token消耗量一开始只是看着玩玩,后来变成谁先进、谁落后,再往后可能就变成能不能留下的门槛。
过去的问题是“你的工作会不会被AI做掉”,现在又多了一个问题:你有没有证明自己在用AI工作?
05 看工具,不看人
这里,也和你分享一下我们自己的做法。
现在每天在得到和得到大脑里大概消耗800亿Token,公司内部同事每天大概消耗20亿Token。当然,这里只统计了通过公司内部AI工具或API接口消耗的算力。
这些数据我们会实时展示在公司前台旁边的大屏上,但不挂任何人名,只展示Token主要用在哪些工具上,比如Claude Code、Codex、OpenClaw,还有我们内部的智能体牛小数、剪辑手爱德华等等。
我把我们6月某一天的大屏图也放在下方了,你可以看看。
▲ 得到AI算力实况大屏你看,把Token挂到人名下面,叫考核人;把Token放到工具分布里,叫观察工具。这两个动作差别很大,前者会诱导刷量,后者能帮你看清楚,钱到底花在了哪里。
06 三条落地建议
说了这么多,你可能好奇到底该怎么做,这里我也和你分享三条落地建议:
看结果,不看Token
AI落地的第一条,不是看员工消耗了多少Token,而是看解决了多少问题。
Token消耗量跟士兵的斩首数很像,它是过程指标,不是结果指标。一个人有没有用好AI,要看工作产出有没有变化,交付速度有没有变快,决策质量有没有变高,以前做不了的事现在能不能做了。
如果这些都没有,Token烧再多也是白搭。
先改考核,再推工具
很多公司的顺序是反的——先买工具,再喊大家用,再把用不用挂到绩效上。结果工具买了,考核还是老一套,员工自然会用老办法对付新工具。
你先把考核从“你用了多少”改成“你解决了什么”,员工反而会主动去找AI,因为解决问题这件事,跟他的利益对上了。
别搞全员动员,先跑一个场景
全公司AI转型这种话,听起来很有气势,但落地时常常每个人都在等别人先试。
更稳的办法,是先找一个痛点最明显、改造成本最低的场景,三个月跑出结果。别人看到真效果,比听十场动员会都有用。
最后说一句大实话:一把手要自己上手。创始人、部门负责人自己不用AI,却天天要求员工用,这事很难成立。
你自己用过,才知道哪里真的省事,哪里只是看起来热闹;也才知道哪些KPI是正经指标,哪些纯粹是在逼人套马。
所以,如果你是管理者,现在最该问的不是“怎么让员工多用AI”,而是:
如果AI是汽车,我们公司前面套着的那匹马,到底是什么?
本内容来源于网络,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。