Notta

配备最新人工智能语音识别引擎的高精度文字转录服务

Open Voice OS

一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。

Soundful

Soundful 使创作者只需单击一个按钮即可生成免版税曲目。Soundful 音乐的音质如此丰富,你不会相信它是用 AI 制作的。但是,不要相信我们的话。试一试!

Musico

Musico 是一个人工智能驱动的软件引擎,可以生成音乐。它可以对手势、动作、代码或其他声音做出反应。

SONIFY.io

Sonify 在音频、数据和新兴技术的交叉领域进行创新。我们设计和开发音频优先的产品和数据驱动的解决方案。

Harmonai

我们是一个社区驱动的组织,发布开源生成音频工具,让每个人都能更轻松、更有趣地制作音乐

INFINITE ALBUM

适合游戏玩家的自适应 AI 音乐

boomy

创建生成音乐,与世界分享.

Riffusion

Riffusion从文本提示生成音乐。尝试您最喜欢的风格,乐器如萨克斯管或小提琴,修饰符如阿拉伯语或牙买加语,流派如爵士乐或福音,声音如教堂钟声或雨声,或任何组合

Natural Language Playlist

Natural Language Playlist 探索语言和音乐之间丰富而复杂的关系,并使用 Transformer 语言模型构建播放列表。由于没有更好的术语,音乐推荐是一种“闭门造车”的东西。

Songtell

Songtell是第一个人工智能生成的歌曲含义库,生成了超过20000首歌曲的含义。你也可以订购一张印有你最喜欢的歌曲含义的海报。

Pop2Piano

Pop2Piano可以帮你改变歌曲和风格,从列表中选择用钢琴改变项目曲风。

SoundRaw AI

面向创作者的 AI 音乐生成器,只需选择情绪、流派和长度,SoundRaw AI就能为你生成优美的歌曲。

Cassette

Cassette能帮助您立即创作出高品质的节拍。 凭借其先进的AI技术,Cassette可以生成与您的音乐视觉相匹配的独特节拍和节奏。 只要向人工智能模型描述你的节拍,应用程序就会完成剩下的工作。

Mubert

人类×人工智能生成音乐,对于您的视频内容、播客和应用程序

网易·天音

网易推出的一站式音乐创作工具

反谱

人工智能实现音乐转乐谱和人声伴奏分离

TME Studio腾讯音乐

分析TME全曲库歌词以及散文、诗歌等多种语料素材,依据智能推荐算法帮你找到合适的押韵词语,打开灵感空间

BGM猫

BGM猫_AI一键生成BGM平台

Audiocraft/MusicGen

一个简单而可控的音乐生成LM,具有文本和旋律调节。

iMyFone MusicAI

人工智能音乐生成器: 轻松制作翻唱歌曲

BeatBot

AI Song Maker 即刻创作属于你的AI音乐

Stable Audio

一个生成音乐和声音的产品

DeepMusic

为音乐行业提供新的体验和方案

唱鸭 AI自动作曲

音乐创作全流程的AI自动作曲工具,集 AI 辅助作词、AI 自动作曲、编曲、混音于一体

Play.ht

Play.ht AI驱动的语音生成器和逼真的文本到语音(TTS)音频转换器使用在线AI语音生成器和最佳合成声音,以MP3和WAV格式立即创建自然的、专业质量的音频。为视频、电子学习课程、播客、IVR系统等创建自定义画外音,支持超过132种语言和口音,并完全支持SSML。

VALL-E

VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。

Text-To-Song

将文本转换成歌曲的工具。它使用自然语言处理将文本输入转换为音频组合。该工具允许用户从各种音乐风格和乐器中进行选择,以及调整节奏、键和动态等参数。生成的音轨可以导出为高质量的音频文件。

Synthesizer V

Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。

Poly.ai

我们现在正在构建下一代语音助手,能够在客户服务中处理真正的人类对话。

WellSaid labs

WellSaid是一款人工智能文本转语音工具,允许用户根据文本创建真实、自然的画外音。它提供了一系列语音化身,并帮助团队在项目上协作,允许更快的生产时间。它适用于企业,可用于各种应用,如有声书、营销、客户支持等等。

LiSTNR

Listnr是一个人工智能语音生成器和文本到语音的在线工具,允许用户从142种不同语言的900多个声音的文本创建逼真的画外音。

MURF.AI

在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示

Uberduck

Uberduck是一个开源的语音AI社区,可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音,并使用他们的AI生成的说唱工具创建自己的自定义语音克隆。

Speech Studio

Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。

Speechify

Speechify是一款文本转语音的应用程序,通过将文本转换成自然的声音,帮助你理解和记住更多你所阅读的内容。它可以在Chrome、iOS、Android和Mac上使用。

Verbatik

Verbatik是一款由人工智能驱动的文本到语音生成器,提供了一个不断增长的库,包含142种语言和口音的600多种自然声音。

DeepZen

DeepZen是一个数字语音解决方案平台,提供栩栩如生、情感丰富的文本音频内容。该公司为有声书、广告、营销、品牌语音以及播客、游戏和虚拟助手等其他类型的语音内容提供数字语音解决方案。

LOVO.AI

LOVO AI是下一代AI画外音&文本到语音平台

Eleven Labs

Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。

SpeechEasy

SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单直观,采用隐私优先的方法来保护用户信息。

TTS-Voice-Wizard

TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。

第一页 · 上一页 · 下一页 · 当前第21页