刚刚,老黄重新发明PC!全球首个Agent原生电脑问世

浏览38次 点赞0次 收藏0次

【导读】四十年来第一次,整条PC产品线被推倒重来!英伟达RTX Spark超级芯片把6144个GPU核心、128GB内存塞进笔记本,数据中心级算力随身带走。

英伟达GTC大会,大幕拉开!

就在刚刚,老黄再次站上绝对C位,开启了震撼全场的主题演讲——

有用AI的时代,全面来临。


全场压轴好戏,是英伟达首款RTX Spark「超级芯片」!

它史无前例地搭载了6144个GPU核心、128GB统一内存,把过去只有数据中心才有的算力,塞进了一台笔记本。

全球首款专为Agent打造的Windows PC,此刻诞生了。


一眼看懂老黄这场2小时硬核演讲:

  • Vera Rubin全面量产,组装一个机架从两小时砍到五分钟

  • Vera CPU登场,第一颗不为人、只为Agent造的CPU

  • RTX Spark(N1X),全球首台为个人Agent打造的个人电脑

  • Nemotron 3 Ultra开源,英伟达最大模型,5500亿参数


超级芯片RTX Spark首秀

PC被彻底重新发明

这场大会最重量级的发布,非「超级芯片RTX Spark」莫属。

「四十年后,英伟达要和微软,一起重新发明PC」!

黄仁勋这句话一出口,全场炸了。



他先讲了段历史。Windows 3.1时代,PC还只是企业的工具,直到Windows 95,才把PC变成了人手一台的消费电子。

而今天,那个让一切发生的「DirectX加应用」组合,要被「LLM加Agent」彻底取代。

大模型,就是新时代的DirectX。Agent,就是新时代的应用。

然后,他掏出了那颗「超级芯片」RTX Spark,核心是和联发科联手打造的N1X CPU。

这是有史以来能效最高的PC芯片!




老黄说,这是英伟达把33年的全部积累,蒸馏进了一颗芯片。

  • Blackwell RTX GPU,6144个CUDA核心,1 PFLOP的AI算力

  • 定制20核Grace CPU,与联发科联手打造

  • 128GB统一内存,NVLink全程融合

  • 台积电3nm工艺,700亿晶体管

英伟达100%的软件栈,全跑在这上面。


更重磅的是,这不止一台笔记本。

微软和英伟达一口气端出桌面、笔记本、工作站三件套,全部100% Windows兼容、100% CUDA、100% Tensor Core。



那台桌面机最有意思。它能让Agent7天24小时跑着,不计费。

没有额度焦虑,下载一个本地模型,这个Agent就彻底是你自己的。


而那台名叫DGX Station for Windows的怪兽,直接堆到768GB内存、20 PFLOPS算力、8TB/s内存带宽。

未来在个人桌面上,跑一个万亿参数的模型,都不是问题。

老黄说,这是四十年来第一次,整条PC产品线被推倒重来。一条新的产品线,一个新的开始。


Vera Rubin全面量产

为Agent而造

接下来,当传闻中的「性能怪兽」Vera Rubin真机登场那一刻,全场瞬间沸腾。

老黄在台上掷地有声,「Vera Rubin不只是为了跑AI而生的,它是为了运行Agent而生」!

如今,Vera Rubin正全面投入量产。

供应链规模是上一代Grace Blackwell的两倍。过去组装一个机架要两个小时,现在只要五分钟。

你没看错,五分钟。


当场,他对Vera Rubin真机来了一次「解剖」。

  • Vera Rubin NVLink 72,整个系统的核心大脑,72块Rubin GPU加36颗Vera CPU

  • Vera CPU机架,256颗全液冷CPU

  • Vera BlueField存储与安全处理系统

  • Mellanox网络系统,世界上第一个CPO共封装光学

最抓眼球的,是Vera Rubin硬件形态的终极进化,无电缆、无软管、无风扇。

老黄把它从台上推走时还调侃,后面大概有2000个人在拉。


Vera CPU:老黄把CPU重造了一遍

在Vera Rubin背后,植入的是英伟达专为Agentic AI时代打造的CPU,Vera CPU。

老黄的解释很深刻,「到今天为止,世界上所有的CPU都是为人造的。这一刻,Vera CPU是给智能体用的」。

既然是为Agent定制的CPU,Vera必须具备超越常理的特性。老黄总结了三个硬核指标。


第一,世界第一的单核性能。

Vera做到了每个时钟周期抓取、解码、执行10条指令,创下世界最高纪录。

第二,每核带宽和总线带宽,刷新天花板。

Vera内部用一张「光速级」的Scalable Coherency Fabric把所有核心连起来,没有chiplet税,没有跨芯片边界的损耗。

它还是第一颗用上PCIe Gen6的CPU,配1.2TB/s的LPDDR5X带宽,是市面最强x86 CPU的2到3倍。


第三,极致的能效。

要把尽可能多的CPU塞进AI数据中心,又不能抢走生成token那点宝贵的电力。



实测里,对比x86,Vera CPU跑SQL的速度狂飙3倍。盯纽交所那种实时流处理,更是直接拉到6倍。

老黄给了一个极致的比喻,「CPU是指挥家,GPU是交响乐团」。


Agent,就是新的「操作系统」

老黄抛出了一个更底层的判断,「我们进入了全新的Agent时代,智能体就是未来的操作系统」。

传统时代,计算机的运行逻辑是,应用层加代码加操作系统。

而今天,这个架构变成了,智能体+Harness。


输入与感知、推理与规划、工具调用与行动,加上短期和长期记忆,构成了智能体完整的工作流。

这里面,LLM负责「思考」,而Harness就像一个操作系统,负责连接一切、调度信息。

硬件就位,还差软件生态。

现场,老黄端出了NVIDIA Agent Toolkit,四层架构。

  • 模型层,Nemotron 3 Ultra,英伟达最大的开源模型,约5500亿总参数,每token激活550亿

  • 框架层,支持Claude Code、Codex、OpenClaw等各种Agent直接运行

  • 工具和技能层,CUDA X库全部附带skills文件,Agent自学即用

  • 运行时层,OpenShell,英伟达的开源安全运行时,Apache 2.0


这四层叠起来,就是一个无敌的Agent系统。

就拿英伟达和Cadence联合打造的「芯片设计超级Agent」来说。

其中,Codex负责总指挥,Cadence ChipStack启动RTL验证循环,底层跑Nemotron模型,外层套OpenShell做安全。

Agent自己跑仿真、做形式化验证、发现设计缺陷、修复代码bug,整个过程自驱动,人类工程师可以在任何环节介入。

验证周期从数周压缩到数小时,加速超过40倍。


这就是Agentic AI。为了这一天,英伟达已经准备了整整两年!

算力就是营收,AI工厂来了

对AI大厂来说,他们其实不想买计算机,想要的是一座AI工厂。

于是英伟达又往上长了一层,叫DSX,一套AI工厂的施工蓝图。


先在Omniverse里建一座数字孪生工厂,电力、散热、网络全部模拟验证一遍,一个机架还没运到,整座工厂已经在虚拟世界里跑通了。


工厂一通电,DSX OS接管运营。

DSX Max LPS负责榨电,今天的AI工厂普遍超配电力高达40%,而它能在同样的电力预算下塞进更多GPU,45度的热液冷更省水更省电。


老黄说,到本世纪末,100吉瓦的AI工厂要陆续上线。

算力就是营收,算力就是利润。没有营收和利润,就是亏损。

这一层,把英伟达从一家卖芯片的公司,彻底变成了一家卖整座工厂的公司。


这里,老黄再次祭出了自己的经典语录:「买越多,赚越多!」

Agent时代,用户再不是人类

两个小时,几十个发布点砸下来。

但老黄从头到尾,其实只讲了一句话。

过去四十年,计算机是为人造的。从今天起,它要为Agent造。

CPU重做,PC重新发明,数据中心重构,软件栈重搭,全是这一句话的注脚。

上一个敢说「重新发明PC」的人,掏出来的是iPhone,它重新定义了人和设备的关系。

这一次,老黄掏出来的东西看着没那么性感,但它要重新定义的是另一件事。

谁,才是这台设备真正的主人。

参考资料:

https://www.youtube.com/watch?v=wSp6AiNIrsY

编辑:摩西 桃子

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它往往能得到较好的回响。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。
最新资讯