AMD ROCm 7.2.0 正式发布:支持多款新硬件,优化 Instinct AI 性能

2026-01-26 发布 · 浏览32次 · 点赞0次 · 收藏0次

1 月 26 日消息,AMD 上周正式发布了 ROCm 开源软件堆栈的 7.2.0 版本。这一版本新增了对多款新硬件的正式支持,并优化了 Instinct MI350 系列与 MI300X 显卡加速器的 AI 表现

具体来看,ROCm 现已正式支持 AMD Radeon AI PRO R9600D、Radeon RX 9060 XT LP、Radeon RX 7700 三款独立显卡和最近推出的锐龙 AI 400 系列处理器。

同时,这一版本在 Instinct MI355X 上显著提升了 Meta Llama 3.1 405B 模型的推理表现,通过内核级调优和内存带宽提升实现了吞吐量提升和延迟降低;优化了 Llama 3 70B 和 Llama 2 70B 在 MI355X、MI350X 上的性能;在 MI300X 上优化智谱 GLM-4.6 的 GEMM 算子性能和 DeepSeek 的 DeepEP 开源通信库表现。

ROCm 7.2.0 还包含其它一系列改进,包括提升 HIP 运行时性能、新增对多 GPU 节点的节点电源管理等。

AMD ROCm 7.2.0 正式发布:支持多款新硬件,优化 Instinct AI 性能 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。