
Otter.ai
Otter.ai是一个自动的会议记录和笔记工具,帮助团队充分利用他们的会议。它可以加入Zoom、Microsoft Teams或谷歌Meet会议,以记录和分享笔记,突出关键要点,并直接将会议幻灯片添加到笔记中。它还包括关键字的摘要和大纲,以帮助团队快速浏览会议笔记、搜索、阅读和播放音频。

阿里翻译
全球214种语言,深耕多个垂直领域

coqui.ai
在几秒钟内克隆您的声音或从我们可用的 AI 声音中进行选择,每个版本都会添加更多.

ReadSpeaker
ReadSpeaker 提供了一系列强大的文本转语音解决方案,可在任何环境中即时部署逼真、定制的语音交互。

Poly.ai
我们现在正在构建下一代语音助手,能够在客户服务中处理真正的人类对话。

MURF.AI
在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示

Krisp
Krisp是一款人工智能降噪工具,适用于Mac和Windows。它可以消除通话中的背景声音、噪音和回声,让用户安心。它还在每次通话结束时提供有用的见解,包括通话时间、会议见解和通话摘要。Krisp受到全球品牌的信任,并提供安全加密的连接,SOC-2,谷歌OAuth和SAML。

肇观电子
让残障人士在内的每个人都生活的更好

Speechify
Speechify是一款文本转语音的应用程序,通过将文本转换成自然的声音,帮助你理解和记住更多你所阅读的内容。它可以在Chrome、iOS、Android和Mac上使用。

Dubverse.ai
只需单击一个按钮,即可使您的内容支持多种语言,并覆盖更多人。

Blogcast™
BlogcastTM是一个文本转语音的工具,允许用户创建播客、视频、电子学习课程的音频和音频书籍,而无需录制。它由人工智能驱动的文本转语音技术提供支持,并提供多种声音和语言可供选择。该工具还提供托管、播客订阅、媒体播放器、WordPress插件,以及与RSS订阅同步的功能。

Filme®
AI 文字转语音生成器和语音克隆

FlexClip
在线视频编辑器

SpeechEasy
SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单直观,采用隐私优先的方法来保护用户信息。

Verbatik
Verbatik是一款由人工智能驱动的文本到语音生成器,提供了一个不断增长的库,包含142种语言和口音的600多种自然声音。

寒武纪
打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片

DeepL-translator
DeepL Pro是一款由人工智能和神经网络提供支持的专业翻译服务,可跨多种设备和应用程序(包括文档、网页、电子邮件和口头对话)提供准确、安全和可定制的翻译

LiSTNR
Listnr是一个人工智能语音生成器和文本到语音的在线工具,允许用户从142种不同语言的900多个声音的文本创建逼真的画外音。

捷通华声—人工智能技术与服务提供商
“灵云科技 源自清华 服务全球”的发展战略

Convai Technologies Inc.
Convai Technologies Inc.为...

voice.ai
我们正在构建语音技术的未来

voicemod
使用我们的实时AI 变声器和音板表达自己,随时随地在元宇宙中成为您想要的人。为Roblox、OBS、VRChat、Discord等平台打造您的声音身份。

podcast.ai
在 Play.ht,我们相信未来所有的内容创作都将由 AI 生成,但由人类指导,而最具创造性的工作将取决于人类将他们想要的创作表达给机器的能力。

MetaVoice Studio
MetaVoice Studio允许用户录制自己的声音或上传文件来创建自定义语音剪辑。它提供了一个免费的计划,有6个声音,30秒的剪辑长度,和一个非商业许可。付费计划包括8个声音、10分钟剪辑长度、商业许可和自定义声音(即将推出)。它还提供了具有自定义定价、API访问和微调支持的企业解决方案。

Dolly AI
Fork your voice in a flash

SO-VITS-SVC4.0
SO-VITS-SVC4.0详细安装、训练、推理使用步骤

云蝠智能
优秀的AI对话能力OEM集成商

Relayed
Relayed是一款人工智能驱动的视频会议工具,旨在帮助团队克服远程工作、繁忙的日程安排和会议疲劳。它具有灵活的视频会议,异步对话,自动摘要,通过秘密链接和限制访问轻松共享,以及统一通信,并能够在以后重新访问和共享对话。

Synthesizer V
Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。

WellSaid labs
WellSaid是一款人工智能文本转语音工具,允许用户根据文本创建真实、自然的画外音。它提供了一系列语音化身,并帮助团队在项目上协作,允许更快的生产时间。它适用于企业,可用于各种应用,如有声书、营销、客户支持等等。

Resemble.ai
Resemble.ai的AI语音生成器是一个完整的生成式语音AI工具包,允许您在几秒钟内创建类似人类的声音。

Uberduck
Uberduck是一个开源的语音AI社区,可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音,并使用他们的AI生成的说唱工具创建自己的自定义语音克隆。

LOVO.AI
LOVO AI是下一代AI画外音&文本到语音平台

TTS-Voice-Wizard
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。

Narration Box
Narration Box是一种语音合成服务,用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者,支持20多种语言,功能强大的语音编辑器,以及博客和新闻网站的音频小部件。它还包括常见问题解答、反馈、更新等资源。它是免费的,并提供了分发、分析、盈利等工具。

Spakfly
Spakfly是一款文本转语音软件,可以将任何文本转换成逼真的、听起来像人的画外音。它支持65种语言和400多种不同的声音,并有标准和AI(神经语音)选项。它还提供了一个灵活的定价模式,包括现收现付、套餐和订阅选项。

MotionSound
AI智能生成语音技术,简单易用的文本转语音工具,能适应多场景需求,配音、演讲不再有烦恼

zeroscope_v2_XL
管道标签不在官方列表中

Avatar AI
人工智能成像模型,可以从你的照片中生成逼真的4K头像。它将方形头像扩展为2:3的4K全尺寸AI照片,并可以将其动画化为带有文本转语音或您自己的声音的AI视频。

腾讯AI实验室
共同打造产学研用一体的 AI 生态

滴滴人工智能实验室
全球智能交通的前沿科技实验室

知存科技
专注研发基于存算一体先进技术的人工智能芯片