反谱
人工智能实现音乐转乐谱和人声伴奏分离
Otter.ai
Otter.ai是一个自动的会议记录和笔记工具,帮助团队充分利用他们的会议。它可以加入Zoom、Microsoft Teams或谷歌Meet会议,以记录和分享笔记,突出关键要点,并直接将会议幻灯片添加到笔记中。它还包括关键字的摘要和大纲,以帮助团队快速浏览会议笔记、搜索、阅读和播放音频。
Altered Studio Voice Editor
Altered Studio Voice Editor允许用户通过将他们的声音更改为任何精心策划的组合声音或自定义声音来创建专业的声音表演。它还允许用户创建引人入胜的多角色表演和克隆他们的声音。该工具还直接在浏览器中为用户提供音频编辑功能,并提供最大的安全性。
Poly.ai
我们现在正在构建下一代语音助手,能够在客户服务中处理真正的人类对话。
Rask.ai
为您提供翻译和配音视频的机会
voicemod
使用我们的实时AI 变声器和音板表达自己,随时随地在元宇宙中成为您想要的人。为Roblox、OBS、VRChat、Discord等平台打造您的声音身份。
ReadSpeaker
ReadSpeaker 提供了一系列强大的文本转语音解决方案,可在任何环境中即时部署逼真、定制的语音交互。
Nuance
Nuance是一家语音识别、自然...
Harmonai
我们是一个社区驱动的组织,发布开源生成音频工具,让每个人都能更轻松、更有趣地制作音乐
Endel.io
可帮助您集中注意力、放松身心和入睡。以神经科学为后盾。
Riffusion
Riffusion从文本提示生成音乐。尝试您最喜欢的风格,乐器如萨克斯管或小提琴,修饰符如阿拉伯语或牙买加语,流派如爵士乐或福音,声音如教堂钟声或雨声,或任何组合
TME Studio腾讯音乐
分析TME全曲库歌词以及散文、诗歌等多种语料素材,依据智能推荐算法帮你找到合适的押韵词语,打开灵感空间
VALL-E
VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。
LiSTNR
Listnr是一个人工智能语音生成器和文本到语音的在线工具,允许用户从142种不同语言的900多个声音的文本创建逼真的画外音。
Speech Studio
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。
Voicepods
Voicepods是一个在线文本转语音平台,允许用户在30秒内将任何书面文本转换为音频文件。它提供了16种多种语言的国际声音和一个表达性内容编辑器来定制声音的输出。
DeepZen
DeepZen是一个数字语音解决方案平台,提供栩栩如生、情感丰富的文本音频内容。该公司为有声书、广告、营销、品牌语音以及播客、游戏和虚拟助手等其他类型的语音内容提供数字语音解决方案。
LOVO.AI
LOVO AI是下一代AI画外音&文本到语音平台
SpeechEasy
SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单直观,采用隐私优先的方法来保护用户信息。
TTS-Voice-Wizard
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。
AiSofiya
Sofiya是一款由人工智能驱动的文本到语音转换器,可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率,并有一个强大的声音工作室,以合并和增强音频效果。它是一款多功能工具,可用于客户服务聊天机器人、语音助手、教育聊天机器人、用于自然语言处理任务的文本生成等。
Blogcast™
BlogcastTM是一个文本转语音的工具,允许用户创建播客、视频、电子学习课程的音频和音频书籍,而无需录制。它由人工智能驱动的文本转语音技术提供支持,并提供多种声音和语言可供选择。该工具还提供托管、播客订阅、媒体播放器、WordPress插件,以及与RSS订阅同步的功能。
Spakfly
Spakfly是一款文本转语音软件,可以将任何文本转换成逼真的、听起来像人的画外音。它支持65种语言和400多种不同的声音,并有标准和AI(神经语音)选项。它还提供了一个灵活的定价模式,包括现收现付、套餐和订阅选项。
Filme®
AI 文字转语音生成器和语音克隆
PlayHT
AI语音生成器,在线现实文本到语音
MotionSound
AI智能生成语音技术,简单易用的文本转语音工具,能适应多场景需求,配音、演讲不再有烦恼
TTSReader
立即以自然动听的声音大声读出任何文本
Mix.audio
Mix.adio,多模式人工智能音乐生成器,您快速而独特的音乐创作解决方案。旨在将音乐“混合”到各种创意作品中变得轻而易举。以文本、图像或声音的形式输入您的想法,即可立即获得多达四首量身定制的曲目。它允许任何人毫不费力地将想法融入音乐中,无论他们的音乐专业知识或创作挑战如何。Mix.adio 是 YouTuber、播客和游戏开发商的理想选择,它提供无版权音乐,确保使用无忧。使用此 CES 2023 和 GDA 2024 认可的工具提升您的内容。
歌词AI鉴赏
用AI的力量理解你最喜欢的歌曲,发现音乐的美妙和感动
鼎斯韦AI工具箱
基于大模型的智能助手、音频分析、todo list任务管理等产品和服务
Krisp
Krisp是一款人工智能降噪工具,适用于Mac和Windows。它可以消除通话中的背景声音、噪音和回声,让用户安心。它还在每次通话结束时提供有用的见解,包括通话时间、会议见解和通话摘要。Krisp受到全球品牌的信任,并提供安全加密的连接,SOC-2,谷歌OAuth和SAML。
voice.ai
我们正在构建语音技术的未来
Sonantic.io
Sonantic Limited是一个利用人工智能,通过其API及网络应用程序进行内容创作、分析、编辑及分发的文字转语音工具。
podcast.ai
在 Play.ht,我们相信未来所有的内容创作都将由 AI 生成,但由人类指导,而最具创造性的工作将取决于人类将他们想要的创作表达给机器的能力。
Dubverse.ai
只需单击一个按钮,即可使您的内容支持多种语言,并覆盖更多人。
Audo AI
Audo AI为创作者和开发人员提供噪声消除产品,包括Audo Studio、Audo API和用于Linux的Magic Mic。这些产品利用音频处理和人工智能的最新进展,自动去除背景噪音,增强音频录制,在任何环境下为用户提供清晰易懂的语音。
MetaVoice Studio
MetaVoice Studio允许用户录制自己的声音或上传文件来创建自定义语音剪辑。它提供了一个免费的计划,有6个声音,30秒的剪辑长度,和一个非商业许可。付费计划包括8个声音、10分钟剪辑长度、商业许可和自定义声音(即将推出)。它还提供了具有自定义定价、API访问和微调支持的企业解决方案。
Dolly AI
Fork your voice in a flash
SO-VITS-SVC4.0
SO-VITS-SVC4.0详细安装、训练、推理使用步骤
iMyFone MagicMic
iMyFone Filme provides multiple voice editing tools to turn your powerful moment
TTS-vue
搬运请注明出处。
TTS Online
提供200多种声音选择,并支持多款热门游戏角色语音生成
AI 中文社