
Otter.ai
Otter.ai是一个自动的会议记录和笔记工具,帮助团队充分利用他们的会议。它可以加入Zoom、Microsoft Teams或谷歌Meet会议,以记录和分享笔记,突出关键要点,并直接将会议幻灯片添加到笔记中。它还包括关键字的摘要和大纲,以帮助团队快速浏览会议笔记、搜索、阅读和播放音频。

讯飞听见
在线语音转文字,录音转文字

Notta
配备最新人工智能语音识别引擎的高精度文字转录服务

Open Voice OS
一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。

SONIFY.io
Sonify 在音频、数据和新兴技术的交叉领域进行创新。我们设计和开发音频优先的产品和数据驱动的解决方案。

SPLASH
将音乐制作的乐趣带给每个人。

Endel.io
可帮助您集中注意力、放松身心和入睡。以神经科学为后盾。

INFINITE ALBUM
适合游戏玩家的自适应 AI 音乐

Songtell
Songtell是第一个人工智能生成的歌曲含义库,生成了超过20000首歌曲的含义。你也可以订购一张印有你最喜欢的歌曲含义的海报。

Emergent Drums
使用Emergent Drums人工智能生成独特的鼓样本,使用Audialab插件生成无限的鼓样本,全部免版税。

Getsound
Getsound基于当前天气条件的个性化音景。可用于水疗中心、酒店、度假村和工作场所。使用24/7天气监测和物理环境参数,该应用程序创建不断变化且独特的音景。 还提供了20多个音景,如日出,日落,沙漠,丛林,海洋,风和雨。

Mubert
人类×人工智能生成音乐,对于您的视频内容、播客和应用程序

TME Studio腾讯音乐
分析TME全曲库歌词以及散文、诗歌等多种语料素材,依据智能推荐算法帮你找到合适的押韵词语,打开灵感空间

BGM猫
BGM猫_AI一键生成BGM平台

Audiocraft/MusicGen
一个简单而可控的音乐生成LM,具有文本和旋律调节。

DeepMusic
为音乐行业提供新的体验和方案

Synthesizer V
Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。

WellSaid labs
WellSaid是一款人工智能文本转语音工具,允许用户根据文本创建真实、自然的画外音。它提供了一系列语音化身,并帮助团队在项目上协作,允许更快的生产时间。它适用于企业,可用于各种应用,如有声书、营销、客户支持等等。

MURF.AI
在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示

Speech Studio
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。

Speechify
Speechify是一款文本转语音的应用程序,通过将文本转换成自然的声音,帮助你理解和记住更多你所阅读的内容。它可以在Chrome、iOS、Android和Mac上使用。

Eleven Labs
Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。

SpeechEasy
SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单直观,采用隐私优先的方法来保护用户信息。

Quickie
Quickie是一个人工智能驱动的扩展,允许用户生成文本转语音、摘要器、扩展器、推特、歌词和其他功能。它还提供自定义快捷方式,允许用户使用提示和输入建立自己的快捷方式。Quickie是免费的,每个学分1个Quickie,有无限的Quickie付费计划,保存的结果,和无限的自定义Quickie。

Narration Box
Narration Box是一种语音合成服务,用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者,支持20多种语言,功能强大的语音编辑器,以及博客和新闻网站的音频小部件。它还包括常见问题解答、反馈、更新等资源。它是免费的,并提供了分发、分析、盈利等工具。

Blogcast™
BlogcastTM是一个文本转语音的工具,允许用户创建播客、视频、电子学习课程的音频和音频书籍,而无需录制。它由人工智能驱动的文本转语音技术提供支持,并提供多种声音和语言可供选择。该工具还提供托管、播客订阅、媒体播放器、WordPress插件,以及与RSS订阅同步的功能。

Spakfly
Spakfly是一款文本转语音软件,可以将任何文本转换成逼真的、听起来像人的画外音。它支持65种语言和400多种不同的声音,并有标准和AI(神经语音)选项。它还提供了一个灵活的定价模式,包括现收现付、套餐和订阅选项。

逗哥配音神器
一款专门为短视频用户提供AI配音服务的软件平台

魔音工坊
文字转语音,录音转文字,视频转文字,视频转音频等功能,操作十分简单,功能丰富.

Rask.ai
为您提供翻译和配音视频的机会

MotionSound
AI智能生成语音技术,简单易用的文本转语音工具,能适应多场景需求,配音、演讲不再有烦恼

VAS视频加字幕
AI一键视频加字幕、字幕翻译

Translate.Video
Video是一款视频翻译工具,用户可以轻松地将视频翻译成多种语言。该工具在一个易于使用的应用程序中提供自动字幕、字幕翻译、配音、AI画外音、录音和文本生成。

phenaki
phenaki一种从文本生成视频的模型,提示可以随时间变化,视频可以长达数分钟。

zeroscope_v2_XL
管道标签不在官方列表中

Swapface人脸交换
Swapface是一款人工智能工具,允许用户实时创建逼真的人脸交换。它可以用于流媒体、视频通话和娱乐应用程序。该工具使用简单、私密、性价比高、省时。

换脸科技
换脸科技专注人像领域技术研发

Swap AI
Swap AI不限制并发,免费体验,一键化处理

Akool-Face Swap
制作有趣的照片和精彩的视频

Deepswap
可以在机器上更换面部

Face Fusion – 腾讯云
将一张人脸图像对应的人脸特征融合到模板图像中的特定人物上

万彩AI换脸
一键换脸变装,成片效果以假乱真