首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

2025-09-10 发布浏览377次点赞0次收藏0次

9 月 10 日消息，英伟达今日宣布推出新产品 Rubin CPX，这是一款专为大规模上下文处理而设计的专用 GPU，涵盖了像大规模编码和生成视频这样要求高的工作。

该硬件旨在将理解 AI 提示的任务与生成响应的任务区分开，英伟达表示，这将使整个过程对客户的效率更高。

该新硬件预计将作为较大的 Vera Rubin 平台的一部分工作，该平台同时集成了 Vera CPU 和 Rubin GPU。英伟达声称全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能。

首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

从英伟达新闻稿获悉，独立的 Rubin CPX GPU 包含 128GB 的 GDDR7 显存。英伟达承诺，新硬件具有 3 倍的 attention capabilities，并使用公司的 4-bit NVFP4 精度提供 30 petaflops 的计算能力。

英伟达 CEO 黄仁勋将 Rubin CPX 与 RTX 进行了比较，他说：“正如 RTX 革新了图形和物理 AI，Rubin CPX 是首款专为大规模上下文 AI 设计的 CUDA GPU，能够在同一时间推理跨越数百万个知识符号的模型。”他还试图量化客户的投资回报，提到部署新硬件的 1 亿美元投资可以产生 50 亿美元的收益。

英伟达表示，该硬件将得到其完整软件栈的支持，包括 Nemotron —— 其一系列开放的多模态模型，专为构建企业级 AI 代理（旨在自主处理复杂任务的系统）而设计。Nemotron 模型提供不同尺寸，从 Nano 用于设备端应用，到 Super 用于单 GPU 设置，再到 Ultra 用于大型数据中心。

英伟达表示，预计 Rubin CPX 将于 2026 年底推出。

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。