Whisper是OpenAI开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练,这些数据是从网络上收集的。它被设计成对口音、背景噪音和技术语言具有健壮性,并且可以将多种语言的语音转录和翻译成英语。它是一种简单的端到端方法,实现为编码器-解码器Transformer。它还能够执行语言识别和短语级时间戳。它的设计易于使用,具有较高的准确性,允许开发人员为更多的应用程序添加语音接口。
类似的工具
他人最近看的工具
Moonbeam
Moonbeam 是唯一经过专门培训的 AI 写作助手,可帮助您撰写论文、故事、文章、博客和其他长篇内容。
抖音Dreamina – 免费
抖音剪映旗下的一款AI绘画工具,能够根据用户提供的文本内容生成由AI制作的创意图片
比格AI PPT
输入主题,1分钟生成PPT,支持一键换模板。
亚马逊云科技(AIGC扶持计划)
AI Generated Content (AIGC,人工智能自动生成内容),是继专业生产内容(PGC, Professional-generated Content)、用户生产内容(UGC, User-generated Content)之后的新型内容创作方式,可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势,打造新的数字内容生成与交互形态。随着科技的发展,AI 写作、AI 配乐、AI 视频生成、 AI 语音合成、以及近段时间火遍全网的 AI 绘画,都为创作领域带来一波热议, 只要简单输入几个关键词几秒钟之内一幅画作就能诞生。
飞桨PaddlePaddle开发者社区
飞桨PaddlePaddle开发者社区,通过贡献代码、贡献文档、加入讨论与布道,与社区共同进步
AI 中文社
