
SO-VITS-SVC4.0
SO-VITS-SVC4.0详细安装、训练、推理使用步骤

iMyFone MagicMic
iMyFone Filme provides multiple voice editing tools to turn your powerful moment

TTS-vue
搬运请注明出处。

云蝠智能
优秀的AI对话能力OEM集成商

捷通华声—人工智能技术与服务提供商
“灵云科技 源自清华 服务全球”的发展战略

Whisper
Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练

Relayed
Relayed是一款人工智能驱动的视频会议工具,旨在帮助团队克服远程工作、繁忙的日程安排和会议疲劳。它具有灵活的视频会议,异步对话,自动摘要,通过秘密链接和限制访问轻松共享,以及统一通信,并能够在以后重新访问和共享对话。

Otter.ai
Otter.ai是一个自动的会议记录和笔记工具,帮助团队充分利用他们的会议。它可以加入Zoom、Microsoft Teams或谷歌Meet会议,以记录和分享笔记,突出关键要点,并直接将会议幻灯片添加到笔记中。它还包括关键字的摘要和大纲,以帮助团队快速浏览会议笔记、搜索、阅读和播放音频。

讯飞听见
在线语音转文字,录音转文字

Notta
配备最新人工智能语音识别引擎的高精度文字转录服务

SONIFY.io
Sonify 在音频、数据和新兴技术的交叉领域进行创新。我们设计和开发音频优先的产品和数据驱动的解决方案。

SPLASH
将音乐制作的乐趣带给每个人。

INFINITE ALBUM
适合游戏玩家的自适应 AI 音乐

Natural Language Playlist
Natural Language Playlist 探索语言和音乐之间丰富而复杂的关系,并使用 Transformer 语言模型构建播放列表。由于没有更好的术语,音乐推荐是一种“闭门造车”的东西。

Cassette
Cassette能帮助您立即创作出高品质的节拍。 凭借其先进的AI技术,Cassette可以生成与您的音乐视觉相匹配的独特节拍和节奏。 只要向人工智能模型描述你的节拍,应用程序就会完成剩下的工作。

Getsound
Getsound基于当前天气条件的个性化音景。可用于水疗中心、酒店、度假村和工作场所。使用24/7天气监测和物理环境参数,该应用程序创建不断变化且独特的音景。 还提供了20多个音景,如日出,日落,沙漠,丛林,海洋,风和雨。

Mubert
人类×人工智能生成音乐,对于您的视频内容、播客和应用程序

Aiva.ai
我们的使命是通过使用 AI 创建个性化配乐来增强个人能力

TME Studio腾讯音乐
分析TME全曲库歌词以及散文、诗歌等多种语料素材,依据智能推荐算法帮你找到合适的押韵词语,打开灵感空间

BGM猫
BGM猫_AI一键生成BGM平台

Audiocraft/MusicGen
一个简单而可控的音乐生成LM,具有文本和旋律调节。

唱鸭 AI自动作曲
音乐创作全流程的AI自动作曲工具,集 AI 辅助作词、AI 自动作曲、编曲、混音于一体

Synthesizer V
Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。

Poly.ai
我们现在正在构建下一代语音助手,能够在客户服务中处理真正的人类对话。

Uberduck
Uberduck是一个开源的语音AI社区,可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音,并使用他们的AI生成的说唱工具创建自己的自定义语音克隆。

Speech Studio
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。

Verbatik
Verbatik是一款由人工智能驱动的文本到语音生成器,提供了一个不断增长的库,包含142种语言和口音的600多种自然声音。

DeepZen
DeepZen是一个数字语音解决方案平台,提供栩栩如生、情感丰富的文本音频内容。该公司为有声书、广告、营销、品牌语音以及播客、游戏和虚拟助手等其他类型的语音内容提供数字语音解决方案。

SpeechEasy
SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单直观,采用隐私优先的方法来保护用户信息。

TTS-Voice-Wizard
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。

AiSofiya
Sofiya是一款由人工智能驱动的文本到语音转换器,可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率,并有一个强大的声音工作室,以合并和增强音频效果。它是一款多功能工具,可用于客户服务聊天机器人、语音助手、教育聊天机器人、用于自然语言处理任务的文本生成等。

Beepbooply
Beepbooply是一款人工智能驱动的文本转语音工具,允许用户快速轻松地生成具有逼真声音的音频内容。超过80种语言、120种口音和900种声音,用户可以自定义他们的音频,并生成几个小时的高质量音频内容,只需点击一个按钮。Beepbooply提供个人和商业使用的免费和付费级别,并允许无限的下载和项目。

Spakfly
Spakfly是一款文本转语音软件,可以将任何文本转换成逼真的、听起来像人的画外音。它支持65种语言和400多种不同的声音,并有标准和AI(神经语音)选项。它还提供了一个灵活的定价模式,包括现收现付、套餐和订阅选项。

FakeYou
FakeYou是一个使用深度伪造技术生成不同语言和声音的文本到语音的音频剪辑的工具。它允许用户用自己喜欢的角色创建音频剪辑,还提供了人工智能的文本转语音功能。它也有一个视频口型社区,排行榜和赞助人feed。

Audyo
Audyo是一款文本到语音的AI语音转换器,允许用户通过打字创建和编辑人类质量的AI语音。用户可以使用谷歌登录开始使用。

Filme®
AI 文字转语音生成器和语音克隆

PlayHT
AI语音生成器,在线现实文本到语音

呱呱有声-制作平台
长音频内容生产AIGC开放平台

Dubbing大饼AI声音
大饼AI变声器,自然人声效果,千种音色选择,全场景接入支持

魔音工坊
文字转语音,录音转文字,视频转文字,视频转音频等功能,操作十分简单,功能丰富.

MotionSound
AI智能生成语音技术,简单易用的文本转语音工具,能适应多场景需求,配音、演讲不再有烦恼

VAS视频加字幕
AI一键视频加字幕、字幕翻译