谷歌CEO「劈柴」亲自下场分芯片!930亿美元填不饱「算力饥荒」
【导读】当算力成为AI时代的「新石油」,一年930亿美元的资本投入仍拯救不了谷歌的「算力饥荒」,各部门为抢夺芯片争执不下。为此,谷歌专门成立了一个协调算力分配的高管委员会。有时这个问题甚至要由谷歌CEO劈柴(Sundar Pichai)或者Alphabet董事会最终拍板解决。
谷歌算力「闹饥荒」,连CEO「劈柴」也不得不亲自下场分芯片了!
在外界眼中,谷歌是一个富可敌国、资源无限的巨无霸。
它拥有搜索、Chrome、Gmail等数款月活用户超过20亿的超级产品,每一个都是印钞机。
此外,为了保持在AI时代的领先地位,谷歌今年计划投入的资本支出更是达到了910亿至930亿美元。
即便如此,在谷歌内部,仍弥漫着一种「算力饥荒」的焦虑。
今年早些时候,谷歌的一众核心高管被紧急召集,讨论一个在部分员工眼中已经「生死攸关」的问题:
公司的芯片已经不够分了,该怎么协调?
由于算力告急,各大产品线的负责人为争夺有限资源陷入了激烈的拉锯战。
于是,一个全新的高管委员会被组建起来,决定公司有限的算力资源该如何分配:
·是优先供给谷歌云去赚取真金白银?
·是输送给搜索业务稳固江山?
·还是砸向谷歌DeepMind,去赌一个AI的未来?
为分芯片,大佬们「打起来了」
算力短缺在谷歌内部引发了不小的紧张气氛,各大产品线负责人为了有限的算力争执不下。
据一位知情人士透露,新成立高管委员会的目的就是为了简化决策流程,在不同部门之间做到「一碗水端平」。
这些「不同部门」主要包括谷歌云、搜索等产品部门以及专注AI研究的DeepMind。
看一下这个「算力分配委员会」的名单,就能掂量出这场博弈的份量,名列其中的全都是谷歌权力版图中的大佬:
有谷歌Cloud CEO Thomas Kurian,他手握增长引擎。

谷歌Cloud CEO Thomas Kurian
DeepMind掌门人Demis Hassabis,肩负着谷歌的AGI信仰。

DeepMind创始人、CEO Demis Hassabis
DeepMind CTO兼谷歌首席AI架构师Koray Kavukcuoglu,掌控技术底座。

DeepMind CTO兼谷歌首席AI架构师Koray Kavukcuoglu
知识与信息部门高级副总裁Nick Fox,他负责谷歌搜索、广告、地理(包括谷歌Maps)等核心产品,守护着公司主要的现金牛业务。

知识与信息部门负责人Nick Fox
有谷歌高级副总裁James Manyika,他负责研究、技术与社会事务。

James Manyika

Alphabet CFO Anat Ashkenazi
还有掌管钱袋子的Anat Ashkenazi,她是Alphabet CFO 。
显而易见,这是一次顶层的权力重构。
据两位知情人士透露,这个小组在做决定时,试图建立一套理性的评估模型。
他们会权衡:Cloud业务能带来多少收入?谷歌的产品端能实现多少增长?
虽然这些预测往往并不准确。
但核心矛盾在于算力的需求,已经远远超过了供应的极限。给了一方,就意味着另一方的业务可能停摆。
因此,小组在做决定时会权衡各种因素,做出艰难的取舍。
有时,他们甚至不得不将难题上交,由CEO Pichai,甚至Alphabet董事会来最终拍板。

谷歌CEO「劈柴」(Sundar Pichai)
这背后,涉及谷歌三大核心命脉的平衡。
第一条命脉,是未来。
谷歌必须开发出最顶尖的AI模型。这些模型需要吞噬巨量的算力来持续迭代。
在如今各家实验室新模型「你追我赶」的胶着战况下,慢一步,就可能意味着掉队。
第二条命脉,是增长。
谷歌Cloud是公司主要的增长引擎,它需要海量算力来服务客户并维持扩张,这是华尔街最看重的故事之一。
第三条命脉,是生存。
谷歌必须留足算力,支撑其庞大的产品矩阵。其中有7款产品(包括搜索、Chrome和Gmail)的月活用户都超过了20亿。
依附于这些产品的广告业务占据了公司收入的大头,是支撑整个帝国运转的基石。
对此,谷歌发言人在一份声明中表示:
我们有一个严格且持续的流程,以确保算力资源被分配给最重要的优先事项,既要平衡当前的客户和用户需求,也要兼顾推动研究和创新的长期投资。
930亿美金填不饱「算力饥荒」
为了填满巨大的算力「黑洞」,谷歌像其他科技巨头一样,在芯片和服务器的资本支出(Capex)上开启了「激进模式」。
Pichai在最近的财报电话会上表示,Alphabet预计今年的资本支出将在910亿到930亿美元之间,几乎是2024年的两倍。
但挑战在于,即便砸下近千亿美金,也无法立竿见影地变出算力。
建数据中心和造芯片的周期很长,谷歌当下的算力困境,实际上是在为前几年的决策买单。
2023年,谷歌的资本支出仅为320亿美元,这个投入在AI爆发的前夜显得有些保守,正是这种滞后效应,导致了如今的被动。
算力紧张的问题在科技公司内部其实存在多年了,但随着这两年AI需求的爆发,矛盾愈发尖锐。
几乎所有主流云厂商都喊着算力不够,无法满足客户需求。
Alphabet的CFO Ashkenazi在10月份的财报电话会上坦承:
虽然我们一直在全力增加产能,加快服务器部署和数据中心建设……但我们预计,第四季度和2026年,供需依然会很紧张。
也就是说,这种紧日子的状态,可能还要持续两年。
在新的委员会成立之前,负责分配的是一个名为「机器学习战略与分配」(MLSA)的机构。
那是一个规模庞大、包含了谷歌各个产品线领导的组织,因此往往也很难达成共识。
新小组的成立,正是为了打破这种低效的共识机制,让权力更集中,决策更果断。
同时,也为外界提供了一个观察谷歌内部权力流向的窗口:究竟是哪个部门在谷歌内部的话语权最重。
Ashkenazi在今年春天的摩根士丹利会议上透露:2025年,谷歌预计会将约一半的算力分配给Cloud业务。
Cloud业务似乎暂时占据了上风。
但知情人士指出,谷歌的算力规划是一个动态过程。
哪怕切分方案已定,随着新产品的发布和市场的反馈,需求随时会波动。
明年,谷歌算力分配的变量依然巨大,比如:
AI研究取得了重大突破,或者签下了一个云服务大单,又或者是OpenAI又搞出了什么大动作,逼得谷歌再次拉响「红色警报」。
即便芯片到手,也不意味着万事大吉。
在谷歌复杂的供应链中,任何一个环节的延误,都可能导致部署计划的推迟,迫使谷歌再次调整计划。
值得庆幸的是,谷歌拥有TPU(张量处理单元)这一杀手锏,这种自研芯片可以用于训练自家的AI模型。
随着TPU性能的提升,这意味着谷歌可以用更少的芯片跑出更好的AI模型。
但这只能在一定程度上缓解「算力饥荒」,并非终极的解决之道。
执行层的「算力生存法则」
如果说高层考虑的是整个战略棋局,着眼的更多是长期问题。
执行层才是真实的生存战场,他们在乎的更多是眼下的问题。
这就导致算力分配的指令到了执行层就会呈现出另一番景象:
谁能给谷歌赚最多的钱,谁就优先。
战略优先变成了赚钱优先。
具体到了部门内部,情况又会有所不同。
以谷歌DeepMind为例,规则显得更加复杂和微妙。
算力分配权主要掌握在Kavukcuoglu及其麾下的副总裁手中。
按规定,研究人员应专注单一项目,并据此获得算力配额。
但在资源匮乏的现实下,「上有政策,下有对策」成了心照不宣的秘密。
知情人士称,那些明星级的独立贡献者(IC),往往享有某种「特权」:
他们能同时挂名多个项目。这意味着他们手中握有多个算力池,可以灵活调配,左右逢源。
而对于普通研究员来说,当算力耗尽、项目未完时,他们必须学会一套独特的「生存法则」。
比如,彼此之间「互借」算力——
或者是许诺「礼尚往来」:「这次你帮我,下次我资源富裕了还你」。
又或者是基于劳动的交换:「我帮你修复几个棘手的Bug,你借我一点卡时跑个模型。」
930亿美金的宏大投入,到了基层员工层面就变成了每个人对算力的精打细算。
最核心的生产资料算力,成了一种要靠人情、关系、私下交换来流通的「硬通货」。
在当前全球性AI军备竞赛下,即使是像谷歌这样的巨头,有时也不得不面对「算力饥荒」的焦虑与匮乏。
参考资料:
https://www.theinformation.com/articles/inside-balancing-act-googles-compute-crunch?rc=epv9gi
秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标,锁定极速推送!
声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。
游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。
AI 中文社