甲骨文推出全球最大AI超算,作为OpenAI「星际之门」算力核心
【导读】甲骨文于上周发布全球最大云端AI超级计算机「OCI Zettascale10」,由80万块NVIDIA GPU组成,峰值算力高达16 ZettaFLOPS,成为OpenAI「星际之门」集群的算力核心。其独创Acceleron RoCE网络实现GPU间高效互联,显著提升性能与能效。该系统象征甲骨文在AI基础设施竞争中的强势布局。
甲骨文在2025年AI World大会上发布OCI Zettascale10超级集群。
在拉斯维加斯举办的AI World 2025大会上,甲骨文高调推出了一台号称全球最大规模的云端AI超级计算机——OCI Zettascale10。
这个庞然大物横跨多个数据中心,由多达80万块NVIDIA GPU芯片构成,峰值计算性能被宣称可达惊人的16 ZettaFLOPS(即每秒1021次以上浮点运算)。
如此天文数字意味着平均每块GPU可贡献约20 PetaFLOPS算力,接近英伟达最新一代Grace Hopper(Blackwell架构GB300)芯片的水平。
甲骨文此举无疑是在急速升温的AI算力军备竞赛中放出「大招」,试图在云端AI基础设施版图上占据一席之地。
OpenAI巨型集群的动力之源
这套Zettascale10系统已经成为OpenAI庞大算力需求的幕后功臣。
据悉,甲骨文与OpenAI在德州阿比林(Abilene)共建了「星际之门」旗舰AI超级计算集群,而OCI Zettascale10正是其算力骨干。
OpenAI基础设施部门副总裁Peter Hoeschele表示,甲骨文定制的RoCE高速网络架构在「千兆瓦级」规模下最大化了整体性能,同时将大部分能耗都用在了计算上。
换言之,甲骨文研发的这套RDMA over Converged Ethernet网络(代号Acceleron)将海量GPU紧密连接成一个整体,使得OpenAI的大模型训练能够在如此庞大的芯片阵列上高效运转。
正因有了与OpenAI的深度合作背书,Zettascale10一亮相便自带「实战」光环,它已经在为当今业界最严苛的一些AI工作负载提供动力。
Acceleron网络架构揭秘
如此规模的GPU「巨阵」要高效运转,奥秘就在于甲骨文独创的Acceleron RoCE网络架构。
简单来说,Acceleron让每块GPU的网络接口卡(NIC)都充当一个小型交换机,一次可连接到多个隔离的网络交换平面。
这种多平面、扁平化的网络设计大幅降低了GPU之间的通信延迟,并确保即使某一路由出现故障时,训练作业也能自动切换到其它路径继续运行,不至于被迫中断。
相比传统三级交换结构,Acceleron减少了网络层级,使GPU对GPU的直连延迟更加一致,整体性能更具可预测性。
此外,该架构引入了线性可插拔光学模块(LPO)和线性接收光学组件(LRO)等新技术,在不降低400G/800G带宽的前提下削减了网络的能耗与冷却成本。
甲骨文称这种创新网络既提高了效率又降低了成本,让客户可以用更少的电力完成同样的AI训练任务;
NVIDIA公司高管Ian Buck也认可道,正是这种全栈优化的「计算结构」(compute fabric)提供了将AI从实验推进到工业化所需的基础。
峰值神话与现实考验
甲骨文计划在2026年下半年正式向客户提供Zettascale10集群服务,目前这一系统已开始接受预订。
然而,对于16 ZFLOPS的惊人算力,不少业内观察者持保留态度。
该数据尚未经独立机构验证,而且很可能是基于理论峰值算力而非持续实效得出。
据业内报道,甲骨文宣称的16 ZFLOPS有可能利用了极低精度的AI计算指标(例如FP8甚至4比特稀疏运算)来实现。
实际的大模型训练通常需要使用更高精度(如BF16或FP8)的数值格式以保证模型收敛效果,因此16 ZFLOPS这个数字更多体现了甲骨文硬件在理想情况下的上限潜力,而非日常工作负载下可持续交付的性能。
这台「云端巨无霸」真正的实战表现还有待时间检验,只有等到系统明年投入使用,各种基准测试与用户实际反馈才能揭晓它能否如宣称般高效且可靠。
云端AI竞赛的挑战与展望
甲骨文并非孤军奋战。
当前,微软、谷歌、亚马逊等云计算巨头也在争相构建各自的大规模AI集群,它们或采购海量GPU,或研发自家AI加速硬件,云端AI算力版图正迅速扩张。
甲骨文此次押下重注推出Zettascale10,一方面巩固了与OpenAI的战略联盟,另一方面也是向业界宣示其在AI时代不容忽视的新实力。
然而在市场前景上,甲骨文依然面临如何吸引客户的问题。
为此,该公司还发布了新的「多云通用积分」计划,允许运营商用统一的预付积分在甲骨文云及AWS、Azure、Google等多家云服务间自由调配甲骨文数据库和OCI服务。
这项举措旨在降低客户迁移门槛、提高平台黏性,为甲骨文云生态争取更大的用户基础。
OCI Zettascale10的出现展示了云服务商为满足AI空前算力需求所做的大胆探索。
等到明年这套系统真正落地,我们才能知道甲骨文能否凭借这一云端「巨无霸」在激烈的AI基础设施竞赛中抢得先机,并兑现其关于高效、规模和可靠性的承诺。
参考资料:
https://www.oracle.com/news/announcement/ai-world-oracle-unveils-next-generation-oci-zettascale10-cluster-for-ai-2025-10-14/
声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。

游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。