Token吃掉三成工资!硅谷AI账单失控了
【导读】Token单价暴跌到不足1美元,总账单却在爆炸——这是AI经济学里最反直觉的一幕。
每百万Token只花0.99美元。
这是SemiAnalysis——硅谷最硬核的半导体研究机构——自己账单上的真实成本。
但更炸裂的是这个数字:内部大模型Token支出,已经占到员工总薪资的30%。
听起来不少——但反过来算,这笔钱买到的产出,过去得靠好几倍的人力成本才能覆盖。人均每月吞掉近50亿个Token,是Meta人均水平的5倍以上,核心贡献者月消耗更突破1000亿。
原本需要初级分析师花几个小时搞定的Excel模型转换、财报图表制作,如今几分钟内完成,只需要几美元。

SemiAnalysis自己的评价一针见血:这不是10%的效率提升,而是专业服务业的单元经济正在被重写。
研究公司、对冲基金、律所——所有靠人脑吃饭的行业,Token支出占到薪资的两三成,只是时间早晚的问题。
英伟达CEO黄仁勋比谁都急。
今年GTC大会上他直接放话:一个年薪50万美元的工程师,年底Token消费不到25万美元?
「我会彻底抓狂。」

他打算给英伟达每个工程师发相当于半年工资的Token预算,还要让7.5万名员工搭配750万个AI智能体一起干活。
不用AI?老黄说,这跟芯片设计师坚持用纸和铅笔没区别。
Token已经不是工具了,它正在变成新时代的「生产资料」。
但硅谷的另一半,正在为AI账单抓狂
有意思的是,就在SemiAnalysis用Token省下真金白银的同时,硅谷的巨头们正因为AI账单焦头烂额。
Uber是最经典的案例。
去年底公司向5000名工程师推广Claude Code,还搞了排行榜——用得越多,排名越高,内部竞争直接拉满。
结果太成功了:2月工程师使用率32%,3月就飙到84%,到了4月,95%的工程师每月都在用AI,70%的提交代码来自AI生成,而全年预算——已经花完了。
CTO说「要从头重做预算」。后来更狠——Bloomberg曝出,Uber给每位员工设了每月1500美元的Token上限,超了要特批。
但COO Andrew Macdonald在播客里说了句大实话:AI使用量确实在涨,但它跟消费者功能创新之间的联系……目前还看不到。

微软的情况更魔幻。上个月《The Verge》曝出,微软正在取消大部分Claude Code许可证,转向自家的GitHub Copilot CLI。
原因很简单:花钱的速度比产出的速度还快。
英伟达应用深度学习副总裁Bryan Catanzaro在今年4月说得更直接:「对我的团队来说,计算成本远远超过了员工的成本。」
MIT 2024年的研究:在以视觉为主要工作内容的岗位中,只有23%的场景下AI自动化在经济上划算。
剩下77%的情况下,雇人比用AI便宜。
甚至还有工程师吐槽AI智能体在使用中「毁掉了他的数据库和网络」——他称之为「过度使用」的代价。
天价预算、使用失控、翻车不断——硅谷正处在AI经济学最撕裂的阶段。
一边是技术带来前所未有的生产力,一边是账单以同样前所未有的速度膨胀。
成本塌缩才刚刚开始
但SemiAnalysis的核心论点是:别盯着今天的价格看,成本塌缩才刚开始。
先看软件端。
在B300上运行DeepSeek R1,通过wideEP、disagg与MTP三层纯软件优化,单GPU吞吐量能从baseline的1000 tokens/秒飙升至14000 tokens/秒——14倍提升,纯靠代码。

再看硬件端。
最优化配置的GB300 NVL72吞吐量是H100的17倍,切到FP4精度直接拉到32倍。

Opus 4.7的标价是输入5美元/百万、输出25美元/百万,看起来不便宜。
但由于智能体工作负载的输入输出比高达300:1,加上90%以上的缓存命中率,实际混合成本被压到了0.99美元。
连标价的五分之一都不到。
把软件和硬件叠在一起,一个结论很难回避:大模型的毛利率扩张,不是一次性的定价巧合,而是结构性的趋势。
Anthropic今年的ARR从90亿美元冲到了440亿以上,毛利率从38%飙到了70%以上——Token变便宜了,但卖Token的人反而更赚钱了。
Gartner今年3月的报告佐证了这一点:到2030年,万亿参数大模型的推理成本将比2025年下降超过90%。
SemiAnalysis的判断很明确:如果你想预估2027年Token价格,答案就一个字——降。
钱花了,然后呢?
这正是当下AI最撕裂的地方:全球科技公司今年AI资本开支已宣布7400亿美元,比去年暴增69%;同一时间,科技业裁员速度已超去年全年。
钱在狂烧,人在被裁,但Goldman Sachs首席经济学家说了句大实话——AI对经济的实际影响,到目前为止基本为零。
这不是AI不行,而是每一轮基础设施革命都要经历的阵痛:先烧钱建管道,再等水流过来。
电网如此,互联网如此,AI也不例外。
差别只在于,这一次管道铺设的速度,和水流过来的速度,都是上一代人没见过的量级。
SemiAnalysis已经站在水流过来的那一边了——30%的薪资换来了数倍的产出杠杆,而成本曲线还在急剧下降。
至于其他公司:是现在蹚水过河,还是等对岸的人已经建好了城再追。
参考资料:
https://x.com/SemiAnalysis_/status/2070915305858007345
编辑:所罗门
声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!
AI 中文社