DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价

2025-09-29 发布 · 浏览55次 · 点赞0次 · 收藏0次
感谢网友 Keenitn 的线索投递!

9 月 29 日消息,DeepSeek 今日正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。

作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(注:一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

图片

为了严谨地评估引入稀疏注意力带来的影响,官方特意把 DeepSeek-V3.2-Exp 的训练设置与 V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。

图片

目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp。

本次更新带来了 API 大幅度降价,开发者调用 DeepSeek API 的成本将降低 50% 以上

图片

DeepSeek-V3.2-Exp 虽然已经在公开评测集上得到了有效性验证,但仍然需要在用户的真实使用场景中进行范围更广、规模更大的测试。为方便用户进行对比测试,官方为 V3.1-Terminus 临时保留了额外的 API 访问接口。

DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源:

  • HuggingFace

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

  • ModelScope

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp

论文也已同步公开:

https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。