SO-VITS-SVC4.0
SO-VITS-SVC4.0详细安装、训练、推理使用步骤
TTS-vue
搬运请注明出处。
捷通华声—人工智能技术与服务提供商
“灵云科技 源自清华 服务全球”的发展战略
Whisper
Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练
adobe.podcast
AI驱动的音频 增强语音通过消...
Otter.ai
Otter.ai是一个自动的会议记录和笔记工具,帮助团队充分利用他们的会议。它可以加入Zoom、Microsoft Teams或谷歌Meet会议,以记录和分享笔记,突出关键要点,并直接将会议幻灯片添加到笔记中。它还包括关键字的摘要和大纲,以帮助团队快速浏览会议笔记、搜索、阅读和播放音频。
Nuance
Nuance是一家语音识别、自然...
讯飞听见
在线语音转文字,录音转文字
Open Voice OS
一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。
Musico
Musico 是一个人工智能驱动的软件引擎,可以生成音乐。它可以对手势、动作、代码或其他声音做出反应。
Harmonai
我们是一个社区驱动的组织,发布开源生成音频工具,让每个人都能更轻松、更有趣地制作音乐
INFINITE ALBUM
适合游戏玩家的自适应 AI 音乐
Riffusion
Riffusion从文本提示生成音乐。尝试您最喜欢的风格,乐器如萨克斯管或小提琴,修饰符如阿拉伯语或牙买加语,流派如爵士乐或福音,声音如教堂钟声或雨声,或任何组合
Pop2Piano
Pop2Piano可以帮你改变歌曲和风格,从列表中选择用钢琴改变项目曲风。
Cassette
Cassette能帮助您立即创作出高品质的节拍。 凭借其先进的AI技术,Cassette可以生成与您的音乐视觉相匹配的独特节拍和节奏。 只要向人工智能模型描述你的节拍,应用程序就会完成剩下的工作。
Getsound
Getsound基于当前天气条件的个性化音景。可用于水疗中心、酒店、度假村和工作场所。使用24/7天气监测和物理环境参数,该应用程序创建不断变化且独特的音景。 还提供了20多个音景,如日出,日落,沙漠,丛林,海洋,风和雨。
Mubert
人类×人工智能生成音乐,对于您的视频内容、播客和应用程序
Aiva.ai
我们的使命是通过使用 AI 创建个性化配乐来增强个人能力
网易·天音
网易推出的一站式音乐创作工具
TME Studio腾讯音乐
分析TME全曲库歌词以及散文、诗歌等多种语料素材,依据智能推荐算法帮你找到合适的押韵词语,打开灵感空间
songR 歌曲生成器
一款基于人工智能的歌曲生成器。
BGM猫
BGM猫_AI一键生成BGM平台
Audiocraft/MusicGen
一个简单而可控的音乐生成LM,具有文本和旋律调节。
BeatBot
AI Song Maker 即刻创作属于你的AI音乐
Play.ht
Play.ht AI驱动的语音生成器和逼真的文本到语音(TTS)音频转换器使用在线AI语音生成器和最佳合成声音,以MP3和WAV格式立即创建自然的、专业质量的音频。为视频、电子学习课程、播客、IVR系统等创建自定义画外音,支持超过132种语言和口音,并完全支持SSML。
VALL-E
VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。
Text-To-Song
将文本转换成歌曲的工具。它使用自然语言处理将文本输入转换为音频组合。该工具允许用户从各种音乐风格和乐器中进行选择,以及调整节奏、键和动态等参数。生成的音轨可以导出为高质量的音频文件。
Poly.ai
我们现在正在构建下一代语音助手,能够在客户服务中处理真正的人类对话。
coqui.ai
在几秒钟内克隆您的声音或从我们可用的 AI 声音中进行选择,每个版本都会添加更多.
MURF.AI
在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示
Uberduck
Uberduck是一个开源的语音AI社区,可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音,并使用他们的AI生成的说唱工具创建自己的自定义语音克隆。
Speech Studio
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。
Voicepods
Voicepods是一个在线文本转语音平台,允许用户在30秒内将任何书面文本转换为音频文件。它提供了16种多种语言的国际声音和一个表达性内容编辑器来定制声音的输出。
DeepZen
DeepZen是一个数字语音解决方案平台,提供栩栩如生、情感丰富的文本音频内容。该公司为有声书、广告、营销、品牌语音以及播客、游戏和虚拟助手等其他类型的语音内容提供数字语音解决方案。
LOVO.AI
LOVO AI是下一代AI画外音&文本到语音平台
Eleven Labs
Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。
SpeechEasy
SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单直观,采用隐私优先的方法来保护用户信息。
TTS-Voice-Wizard
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。
Narration Box
Narration Box是一种语音合成服务,用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者,支持20多种语言,功能强大的语音编辑器,以及博客和新闻网站的音频小部件。它还包括常见问题解答、反馈、更新等资源。它是免费的,并提供了分发、分析、盈利等工具。
Beepbooply
Beepbooply是一款人工智能驱动的文本转语音工具,允许用户快速轻松地生成具有逼真声音的音频内容。超过80种语言、120种口音和900种声音,用户可以自定义他们的音频,并生成几个小时的高质量音频内容,只需点击一个按钮。Beepbooply提供个人和商业使用的免费和付费级别,并允许无限的下载和项目。
Spakfly
Spakfly是一款文本转语音软件,可以将任何文本转换成逼真的、听起来像人的画外音。它支持65种语言和400多种不同的声音,并有标准和AI(神经语音)选项。它还提供了一个灵活的定价模式,包括现收现付、套餐和订阅选项。
Audyo
Audyo是一款文本到语音的AI语音转换器,允许用户通过打字创建和编辑人类质量的AI语音。用户可以使用谷歌登录开始使用。
AI 中文社