搜索 AI 工具

TTS Online

提供200多种声音选择，并支持多款热门游戏角色语音生成

Otter.ai

Otter.ai是一个自动的会议记录和笔记工具，帮助团队充分利用他们的会议。它可以加入Zoom、Microsoft Teams或谷歌Meet会议，以记录和分享笔记，突出关键要点，并直接将会议幻灯片添加到笔记中。它还包括关键字的摘要和大纲，以帮助团队快速浏览会议笔记、搜索、阅读和播放音频。

呱呱有声-制作平台

长音频内容生产AIGC开放平台

一起剪

一款强大的免费AI在线视频剪辑工具

TTSMaker马克配音

免费的AI配音平台，可以将文本转换成语音，支持50多种语言和300多种语音风格

FakeYou

FakeYou是一个使用深度伪造技术生成不同语言和声音的文本到语音的音频剪辑的工具。它允许用户用自己喜欢的角色创建音频剪辑，还提供了人工智能的文本转语音功能。它也有一个视频口型社区，排行榜和赞助人feed。

Uberduck

Uberduck是一个开源的语音AI社区，可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音，并使用他们的AI生成的说唱工具创建自己的自定义语音克隆。

Fliki.ai

将文本变成带有 AI 语音的视频,在 2 分钟内使用逼真的声音从脚本或博客文章创建视频！

SO-VITS-SVC4.0

SO-VITS-SVC4.0详细安装、训练、推理使用步骤

voicemod

使用我们的实时AI 变声器和音板表达自己，随时随地在元宇宙中成为您想要的人。为Roblox、OBS、VRChat、Discord等平台打造您的声音身份。

讯飞智聘

企业招聘全流程的智能化解决方案

VALL-E

VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说，我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型（称为 VALL-E），并将 TTS 视为条件语言建模任务，而不是像以前的工作那样连续信号回归。

Resemble.ai

Resemble.ai的AI语音生成器是一个完整的生成式语音AI工具包，允许您在几秒钟内创建类似人类的声音。

Dubbing大饼AI声音

大饼AI变声器，自然人声效果，千种音色选择，全场景接入支持

魔音工坊

文字转语音,录音转文字,视频转文字,视频转音频等功能,操作十分简单,功能丰富.

coqui.ai

在几秒钟内克隆您的声音或从我们可用的 AI 声音中进行选择，每个版本都会添加更多.

言犀

人机交互平台，懂业务更懂你

ReadSpeaker

ReadSpeaker 提供了一系列强大的文本转语音解决方案，可在任何环境中即时部署逼真、定制的语音交互。

Altered Studio Voice Editor

Altered Studio Voice Editor允许用户通过将他们的声音更改为任何精心策划的组合声音或自定义声音来创建专业的声音表演。它还允许用户创建引人入胜的多角色表演和克隆他们的声音。该工具还直接在浏览器中为用户提供音频编辑功能，并提供最大的安全性。

voice.ai

我们正在构建语音技术的未来

Artflow.ai

Artflow.ai使用户能够轻松地使用ai生成的原始角色、场景、对话和资产创建动画故事。该工具还提供数百万用户生成的资产，并支持非英语描述。它提供人像2.0和新图像等功能，以及视频工作室功能。

Audyo

Audyo是一款文本到语音的AI语音转换器，允许用户通过打字创建和编辑人类质量的AI语音。用户可以使用谷歌登录开始使用。

知存科技

专注研发基于存算一体先进技术的人工智能芯片

Synthesizer V

Synthesizer V是一款革命性的音乐制作工具，它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成，无限音轨，无核心限制，VST3/AU插件支持，ASIO支持(Windows)， Jack支持(Linux)，跨语言合成，AI重取，孤立的抽吸输出，发声模式，音调偏移参数，Microtonal调整，MIDI键盘支持，节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。

Speech Studio

Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法，可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。

阿里翻译

全球214种语言，深耕多个垂直领域

Sonix

一个自动转录、翻译和字幕平台，快速、准确、实惠。它可以将音频和视频转换为文本，利用其先进的自动翻译引擎在几分钟内翻译文本，并创建全自动字幕

Poly.ai

我们现在正在构建下一代语音助手，能够在客户服务中处理真正的人类对话。

MotionSound

AI智能生成语音技术，简单易用的文本转语音工具，能适应多场景需求，配音、演讲不再有烦恼

讯飞听见

在线语音转文字，录音转文字

TTS-Voice-Wizard

TTS语音向导是一种工具，允许用户通过微软Azure语音识别和TTS将语音转换为文本，然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项，包括100多种不同的声音，20多种支持的语言，并能够显示歌曲标题，艺术家和用户以上的进度。

Tavus

Tavus是一个人工智能视频生成平台，可以自动将你的视频个性化给每个观众。

TTS-vue

搬运请注明出处。

Play.ht

Play.ht AI驱动的语音生成器和逼真的文本到语音(TTS)音频转换器使用在线AI语音生成器和最佳合成声音，以MP3和WAV格式立即创建自然的、专业质量的音频。为视频、电子学习课程、播客、IVR系统等创建自定义画外音，支持超过132种语言和口音，并完全支持SSML。

FineVoice

FineVoice是一种人工智能数字语音解决方案，可以帮助用户增强声音，并实时改变声音。它配有实时变声器，无限的音频和声音效果，录音室质量的录音机，文本到语音，语音到文本。

podcast.ai

在 Play.ht，我们相信未来所有的内容创作都将由 AI 生成，但由人类指导，而最具创造性的工作将取决于人类将他们想要的创作表达给机器的能力。

肇观电子

让残障人士在内的每个人都生活的更好

Krisp

Krisp是一款人工智能降噪工具，适用于Mac和Windows。它可以消除通话中的背景声音、噪音和回声，让用户安心。它还在每次通话结束时提供有用的见解，包括通话时间、会议见解和通话摘要。Krisp受到全球品牌的信任，并提供安全加密的连接，SOC-2，谷歌OAuth和SAML。

MetaVoice Studio

MetaVoice Studio允许用户录制自己的声音或上传文件来创建自定义语音剪辑。它提供了一个免费的计划，有6个声音，30秒的剪辑长度，和一个非商业许可。付费计划包括8个声音、10分钟剪辑长度、商业许可和自定义声音(即将推出)。它还提供了具有自定义定价、API访问和微调支持的企业解决方案。

Text To Speech

构建自然说话的应用和服务，从 147 种语言和变体中选择 456 种语音

腾讯AI实验室

共同打造产学研用一体的 AI 生态

字幕说

在线语音合成、字幕及视频生成工具，制作视频无需出镜

adobe.podcast

AI驱动的音频增强语音通过消...

LipDub

用人工智能在几秒钟内说任何语言

Synthesys

Synthesys是一家领先的AI虚拟媒体平台，用户只需点击几下鼠标就可以制作专业的AI画外音和AI视频。它为用户提供了一个大型的专业声音库，74种humatar, 38种女性和36种男性声音，66种语言和254种风格。它还具有基于云的应用程序、完全定制和高分辨率输出。Synthesys非常适合创建解释器视频，电子学习，社交媒体，产品描述等。

MURF.AI

在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示

Speechify

Speechify是一款文本转语音的应用程序，通过将文本转换成自然的声音，帮助你理解和记住更多你所阅读的内容。它可以在Chrome、iOS、Android和Mac上使用。

Open Voice OS

一个社区驱动的开源语音 AI 平台，用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。

Audo AI

Audo AI为创作者和开发人员提供噪声消除产品，包括Audo Studio、Audo API和用于Linux的Magic Mic。这些产品利用音频处理和人工智能的最新进展，自动去除背景噪音，增强音频录制，在任何环境下为用户提供清晰易懂的语音。

Dolly AI

Fork your voice in a flash

Avatar AI

人工智能成像模型，可以从你的照片中生成逼真的4K头像。它将方形头像扩展为2:3的4K全尺寸AI照片，并可以将其动画化为带有文本转语音或您自己的声音的AI视频。