Play.ht
Play.ht AI驱动的语音生成器和逼真的文本到语音(TTS)音频转换器使用在线AI语音生成器和最佳合成声音,以MP3和WAV格式立即创建自然的、专业质量的音频。为视频、电子学习课程、播客、IVR系统等创建自定义画外音,支持超过132种语言和口音,并完全支持SSML。
VALL-E
VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。
Synthesizer V
Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。
Poly.ai
我们现在正在构建下一代语音助手,能够在客户服务中处理真正的人类对话。
coqui.ai
在几秒钟内克隆您的声音或从我们可用的 AI 声音中进行选择,每个版本都会添加更多.
WellSaid labs
WellSaid是一款人工智能文本转语音工具,允许用户根据文本创建真实、自然的画外音。它提供了一系列语音化身,并帮助团队在项目上协作,允许更快的生产时间。它适用于企业,可用于各种应用,如有声书、营销、客户支持等等。
LiSTNR
Listnr是一个人工智能语音生成器和文本到语音的在线工具,允许用户从142种不同语言的900多个声音的文本创建逼真的画外音。
Resemble.ai
Resemble.ai的AI语音生成器是一个完整的生成式语音AI工具包,允许您在几秒钟内创建类似人类的声音。
MURF.AI
在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示
Speech Studio
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。
Voicepods
Voicepods是一个在线文本转语音平台,允许用户在30秒内将任何书面文本转换为音频文件。它提供了16种多种语言的国际声音和一个表达性内容编辑器来定制声音的输出。
Verbatik
Verbatik是一款由人工智能驱动的文本到语音生成器,提供了一个不断增长的库,包含142种语言和口音的600多种自然声音。
DeepZen
DeepZen是一个数字语音解决方案平台,提供栩栩如生、情感丰富的文本音频内容。该公司为有声书、广告、营销、品牌语音以及播客、游戏和虚拟助手等其他类型的语音内容提供数字语音解决方案。
Eleven Labs
Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。
SpeechEasy
SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单直观,采用隐私优先的方法来保护用户信息。
Quickie
Quickie是一个人工智能驱动的扩展,允许用户生成文本转语音、摘要器、扩展器、推特、歌词和其他功能。它还提供自定义快捷方式,允许用户使用提示和输入建立自己的快捷方式。Quickie是免费的,每个学分1个Quickie,有无限的Quickie付费计划,保存的结果,和无限的自定义Quickie。
TTS-Voice-Wizard
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。
Narration Box
Narration Box是一种语音合成服务,用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者,支持20多种语言,功能强大的语音编辑器,以及博客和新闻网站的音频小部件。它还包括常见问题解答、反馈、更新等资源。它是免费的,并提供了分发、分析、盈利等工具。
Blogcast™
BlogcastTM是一个文本转语音的工具,允许用户创建播客、视频、电子学习课程的音频和音频书籍,而无需录制。它由人工智能驱动的文本转语音技术提供支持,并提供多种声音和语言可供选择。该工具还提供托管、播客订阅、媒体播放器、WordPress插件,以及与RSS订阅同步的功能。
Beepbooply
Beepbooply是一款人工智能驱动的文本转语音工具,允许用户快速轻松地生成具有逼真声音的音频内容。超过80种语言、120种口音和900种声音,用户可以自定义他们的音频,并生成几个小时的高质量音频内容,只需点击一个按钮。Beepbooply提供个人和商业使用的免费和付费级别,并允许无限的下载和项目。
Audyo
Audyo是一款文本到语音的AI语音转换器,允许用户通过打字创建和编辑人类质量的AI语音。用户可以使用谷歌登录开始使用。
FineVoice
FineVoice是一种人工智能数字语音解决方案,可以帮助用户增强声音,并实时改变声音。它配有实时变声器,无限的音频和声音效果,录音室质量的录音机,文本到语音,语音到文本。
PlayHT
AI语音生成器,在线现实文本到语音
配音神器PRO-移动端
配音神器官网_文字转语音神器_配音神器pro_语音合成软件_专业配音神器_AI配音神器
标贝悦读AI配音
提供多种针对不同场景的定制化服务
逗哥配音神器
一款专门为短视频用户提供AI配音服务的软件平台
TTSMaker马克配音
免费的AI配音平台,可以将文本转换成语音,支持50多种语言和300多种语音风格
TTSReader
立即以自然动听的声音大声读出任何文本
VAS视频加字幕
AI一键视频加字幕、字幕翻译
鬼手剪辑GhostCut
高效实现视频去字幕、视频翻译和视频混剪等
phenaki
phenaki一种从文本生成视频的模型,提示可以随时间变化,视频可以长达数分钟。
zeroscope_v2_XL
管道标签不在官方列表中
Stable video diffusion online
免费激活您的图像,用 Stable Video Diffusion online 让图片动起来!
Swapface人脸交换
Swapface是一款人工智能工具,允许用户实时创建逼真的人脸交换。它可以用于流媒体、视频通话和娱乐应用程序。该工具使用简单、私密、性价比高、省时。
Akool-Face Swap
制作有趣的照片和精彩的视频
Face Fusion – 腾讯云
将一张人脸图像对应的人脸特征融合到模板图像中的特定人物上
DeepfaceAI
您可以轻松地在直播和短视频中实现实时换脸
千禾智能AI视频换脸
实现超逼真的视频换脸,高精度的视频抠像,流畅自然的视频插帧,快速高效的视频人脸修复,以及清晰锐利的视频无损放大
Faceswap
根据用户上传的照片和视频进行人脸交换,生成有趣的照片和视频
PhotoFunia
允许您在照片中交换面孔
云间-照片换脸
将两张图片上的人脸一键切换
Digital-Standard(Windows版)
任何人都可以仅用相机轻松开始全身追踪。
AI 中文社