
Audiocraft/MusicGen
一个简单而可控的音乐生成LM,具有文本和旋律调节。

BeatBot
AI Song Maker 即刻创作属于你的AI音乐

Stable Audio
一个生成音乐和声音的产品

唱鸭 AI自动作曲
音乐创作全流程的AI自动作曲工具,集 AI 辅助作词、AI 自动作曲、编曲、混音于一体

Play.ht
Play.ht AI驱动的语音生成器和逼真的文本到语音(TTS)音频转换器使用在线AI语音生成器和最佳合成声音,以MP3和WAV格式立即创建自然的、专业质量的音频。为视频、电子学习课程、播客、IVR系统等创建自定义画外音,支持超过132种语言和口音,并完全支持SSML。

VALL-E
VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。

Synthesizer V
Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。

Poly.ai
我们现在正在构建下一代语音助手,能够在客户服务中处理真正的人类对话。

coqui.ai
在几秒钟内克隆您的声音或从我们可用的 AI 声音中进行选择,每个版本都会添加更多.

Speech Studio
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。

Speechify
Speechify是一款文本转语音的应用程序,通过将文本转换成自然的声音,帮助你理解和记住更多你所阅读的内容。它可以在Chrome、iOS、Android和Mac上使用。

Voicepods
Voicepods是一个在线文本转语音平台,允许用户在30秒内将任何书面文本转换为音频文件。它提供了16种多种语言的国际声音和一个表达性内容编辑器来定制声音的输出。

Verbatik
Verbatik是一款由人工智能驱动的文本到语音生成器,提供了一个不断增长的库,包含142种语言和口音的600多种自然声音。

LOVO.AI
LOVO AI是下一代AI画外音&文本到语音平台

Eleven Labs
Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。

TTS-Voice-Wizard
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。

Narration Box
Narration Box是一种语音合成服务,用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者,支持20多种语言,功能强大的语音编辑器,以及博客和新闻网站的音频小部件。它还包括常见问题解答、反馈、更新等资源。它是免费的,并提供了分发、分析、盈利等工具。

AiSofiya
Sofiya是一款由人工智能驱动的文本到语音转换器,可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率,并有一个强大的声音工作室,以合并和增强音频效果。它是一款多功能工具,可用于客户服务聊天机器人、语音助手、教育聊天机器人、用于自然语言处理任务的文本生成等。

FakeYou
FakeYou是一个使用深度伪造技术生成不同语言和声音的文本到语音的音频剪辑的工具。它允许用户用自己喜欢的角色创建音频剪辑,还提供了人工智能的文本转语音功能。它也有一个视频口型社区,排行榜和赞助人feed。

Filme®
AI 文字转语音生成器和语音克隆

PlayHT
AI语音生成器,在线现实文本到语音

标贝悦读AI配音
提供多种针对不同场景的定制化服务

魔音工坊
文字转语音,录音转文字,视频转文字,视频转音频等功能,操作十分简单,功能丰富.

Rask.ai
为您提供翻译和配音视频的机会

Text To Speech
构建自然说话的应用和服务,从 147 种语言和变体中选择 456 种语音

MotionSound
AI智能生成语音技术,简单易用的文本转语音工具,能适应多场景需求,配音、演讲不再有烦恼

TTSReader
立即以自然动听的声音大声读出任何文本

鬼手剪辑GhostCut
高效实现视频去字幕、视频翻译和视频混剪等

33字幕
AI生成视频字幕,AI字幕翻译

字幕说
在线语音合成、字幕及视频生成工具,制作视频无需出镜

phenaki
phenaki一种从文本生成视频的模型,提示可以随时间变化,视频可以长达数分钟。

zeroscope_v2_XL
管道标签不在官方列表中

Stable video diffusion online
免费激活您的图像,用 Stable Video Diffusion online 让图片动起来!

秋葉aaaki
喂饭区UP主,玩AI的 希望能为大家带来技术的乐趣~

Swapface人脸交换
Swapface是一款人工智能工具,允许用户实时创建逼真的人脸交换。它可以用于流媒体、视频通话和娱乐应用程序。该工具使用简单、私密、性价比高、省时。

换脸科技
换脸科技专注人像领域技术研发

Swap AI
Swap AI不限制并发,免费体验,一键化处理

Akool-Face Swap
制作有趣的照片和精彩的视频

Deepswap
可以在机器上更换面部

我赢助手
AI视频去重工具,去水印,人脸融合

Face Fusion – 腾讯云
将一张人脸图像对应的人脸特征融合到模板图像中的特定人物上

DeepfaceAI
您可以轻松地在直播和短视频中实现实时换脸