语音识别 标签,匹配到约6个结果, 耗时0.0242秒
阿里千问开源 Qwen3-ASR 语音识别模型:支持 52 种语种与方言,1.7B 版本达 SOTA 水平

阿里千问开源 Qwen3-ASR 语音识别模型:支持 52 种语种与方言,1.7B 版本达 SOTA 水平

阿里千问开源 Qwen3-ASR 语音识别模型:支持 52 种语种与方言,1.7B 版本达 SOTA 水平
阿里千问团队正式开源Qwen3-ASR系列语音识别模型,包括1.7B和0.6B两个版本,支持52种语种与方言的识别,其中1.7B模型在中文、英文及歌唱识别等场景达到SOTA水平。0.6B模型效率惊人,10秒可处理5小时音频。模型已在GitH...
2026-01-30 · 浏览268次
豆包语音识别模型 2.0 上线:不仅“听懂字”还能“看懂图”,支持日韩德法等 13 种外语

豆包语音识别模型 2.0 上线:不仅“听懂字”还能“看懂图”,支持日韩德法等 13 种外语

豆包语音识别模型 2.0 上线:不仅“听懂字”还能“看懂图”,支持日韩德法等 13 种外语
模型推理能力提升,通过深度理解上下文完成精准识别,上下文整体关键词召回率提升 20%;支持多模态视觉识别,不仅“听懂字”还能“看懂图”,通过单图和多图等视觉信息输入让文字识别更精准;支持日语、韩语、德语、法语等 13 种海外语种的精准识别。...
2025-12-05 · 浏览207次
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源

打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源

打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
Meta推出全语种自动语音识别系统(Omnilingual ASR),支持1600种语言,其中500种首次被AI覆盖。该系统采用开源协议,助力跨语言沟通与信息可及性。#人工智能# #语音识别#...
2025-11-11 · 浏览275次
伦敦政经学院斥资 400 万英镑建立新研究中心,探索用 AI 架起人、宠物沟通之桥

伦敦政经学院斥资 400 万英镑建立新研究中心,探索用 AI 架起人、宠物沟通之桥

伦敦政经学院斥资 400 万英镑建立新研究中心,探索用 AI 架起人、宠物沟通之桥
该中心首任主任乔纳森·伯奇教授表示,尽管能理解宠物想表达什么听起来令人兴奋,但AI往往倾向于生成讨好用户而非反映真实意图的回答。“如果这项技术被应用于动物福利领域,可能会带来灾难性后果。”...
2025-07-14 · 浏览268次
联发科推出专为中国台湾地区用语及口音设计的开源 AI 语音识别模型

联发科推出专为中国台湾地区用语及口音设计的开源 AI 语音识别模型

联发科推出专为中国台湾地区用语及口音设计的开源 AI 语音识别模型
这一名为MR BreezeASR 25的模型以 Apache 2.0 许可开源公布,不会出现将“发生什么事”听成“花生什么事”等类似识别错误。...
2025-07-03 · 浏览344次
13个优秀开源语音识别引擎

13个优秀开源语音识别引擎

13个优秀开源语音识别引擎
2024年已开始,AI热度不减,以下是几个截止目前比较优秀的开源语音识别引擎。...
2024-01-09 · 浏览3623次
上一页 · 下一页 · 当前第1页