Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供出色正确率表现

2025-07-16 发布 · 浏览35次 · 点赞0次 · 收藏0次

7 月 16 日消息,Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。该系列模型以开源形式推出,可以更低价格提供领先的低错误率表现,支持真实世界的语音智能生产应用

Voxtral 系列模型由 Mistral Small 3.1 派生而来,包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini,此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。

该模型支持 32K Token 的上下文长度,可处理 30 分钟音频转录或 40 分钟音频理解,内置生成相关问题、结构化摘要的能力,支持英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语、意大利语等印欧诸语言。

Mistral AI 宣称 Voxtral Mini Transcribe 在成本敏感用例中性能优于 OpenAI Whisper,而价格不到后者的一半;而在高级用例方面,Voxtral Small 的性能与本领域顶尖模型 ElevenLabs Scribe 接近,价格也不到一半。

Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供出色正确率表现 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。