Copyright © 2022-2025 aizws.net · 网站版本: v1.2.6·内部版本: v1.24.4·
页面加载耗时 0.00 毫秒·物理内存 88.2MB ·虚拟内存 1306.0MB
欢迎来到 AI 中文社区(简称 AI 中文社),这里是学习交流 AI 人工智能技术的中文社区。 为了更好的体验,本站推荐使用 Chrome 浏览器。
6 月 27 日消息,据外媒 The Information 报道,由于美国当局策略致英伟达 H20 芯片在中国内地供应短缺,继而导致 DeepSeek-R2 AI 模型开发工作延迟。
注意到,DeepSeek 使用了 5 万块 Hopper GPU 训练 R1 模型,其中包括 3 万块 H20、1 万块 H800 和 1 万块 H100,这些显卡由其投资方高毅资产(High-Flyer Capital Management)采购。
外媒援引两位知情人士透露,DeepSeek 团队近几个月一直在密集推进 R2 模型开发,但 CEO 梁文锋目前对模型的能力仍不满意,内部仍在继续提升性能,相应模型尚未准备好正式投用。
此外,相应报道同时指出,多数用户都是在英伟达的 H20 芯片上部署 / 运行现有 DeepSeek-R1 模型,随着 H20 芯片遭美国当局限制出口,除了令 DeepSeek R2 的研发更加困难外,也对现有 DeepSeek-R1 实际部署造成一定影响。
声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。