搜索 语音 标签,找到约81个结果, 耗时0.4063秒

TTS Online

提供200多种声音选择,并支持多款热门游戏角色语音生成

Sonix

一个自动转录、翻译和字幕平台,快速、准确、实惠。它可以将音频和视频转换为文本,利用其先进的自动翻译引擎在几分钟内翻译文本,并创建全自动字幕

讯飞听见

在线语音转文字,录音转文字

Audo AI

Audo AI为创作者和开发人员提供噪声消除产品,包括Audo Studio、Audo API和用于Linux的Magic Mic。这些产品利用音频处理和人工智能的最新进展,自动去除背景噪音,增强音频录制,在任何环境下为用户提供清晰易懂的语音。

好未来AI开放平台

提供领先的AI能力与解决方案,助力教育智能化发展

MetaVoice Studio

MetaVoice Studio允许用户录制自己的声音或上传文件来创建自定义语音剪辑。它提供了一个免费的计划,有6个声音,30秒的剪辑长度,和一个非商业许可。付费计划包括8个声音、10分钟剪辑长度、商业许可和自定义声音(即将推出)。它还提供了具有自定义定价、API访问和微调支持的企业解决方案。

TTS-Voice-Wizard

TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。

Convai Technologies Inc.

Convai Technologies Inc.为...

肇观电子

让残障人士在内的每个人都生活的更好

Otter.ai

Otter.ai是一个自动的会议记录和笔记工具,帮助团队充分利用他们的会议。它可以加入Zoom、Microsoft Teams或谷歌Meet会议,以记录和分享笔记,突出关键要点,并直接将会议幻灯片添加到笔记中。它还包括关键字的摘要和大纲,以帮助团队快速浏览会议笔记、搜索、阅读和播放音频。

Verbatik

Verbatik是一款由人工智能驱动的文本到语音生成器,提供了一个不断增长的库,包含142种语言和口音的600多种自然声音。

Narration Box

Narration Box是一种语音合成服务,用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者,支持20多种语言,功能强大的语音编辑器,以及博客和新闻网站的音频小部件。它还包括常见问题解答、反馈、更新等资源。它是免费的,并提供了分发、分析、盈利等工具。

FakeYou

FakeYou是一个使用深度伪造技术生成不同语言和声音的文本到语音的音频剪辑的工具。它允许用户用自己喜欢的角色创建音频剪辑,还提供了人工智能的文本转语音功能。它也有一个视频口型社区,排行榜和赞助人feed。

讯飞智聘

企业招聘全流程的智能化解决方案

Sonantic.io

Sonantic Limited是一个利用人工智能,通过其API及网络应用程序进行内容创作、分析、编辑及分发的文字转语音工具。

捷通华声—人工智能技术与服务提供商

“灵云科技 源自清华 服务全球”的发展战略

Audyo

Audyo是一款文本到语音的AI语音转换器,允许用户通过打字创建和编辑人类质量的AI语音。用户可以使用谷歌登录开始使用。

MotionSound

AI智能生成语音技术,简单易用的文本转语音工具,能适应多场景需求,配音、演讲不再有烦恼

zeroscope_v2_XL

管道标签不在官方列表中

FlexClip

在线视频编辑器

紫东太初 – 多模态大模型

全球首个多模态图文音预训练模型

腾讯AI实验室

共同打造产学研用一体的 AI 生态

寒武纪

打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片

DeepL-translator

DeepL Pro是一款由人工智能和神经网络提供支持的专业翻译服务,可跨多种设备和应用程序(包括文档、网页、电子邮件和口头对话)提供准确、安全和可定制的翻译

阿里翻译

全球214种语言,深耕多个垂直领域

Krisp

Krisp是一款人工智能降噪工具,适用于Mac和Windows。它可以消除通话中的背景声音、噪音和回声,让用户安心。它还在每次通话结束时提供有用的见解,包括通话时间、会议见解和通话摘要。Krisp受到全球品牌的信任,并提供安全加密的连接,SOC-2,谷歌OAuth和SAML。

ReadSpeaker

ReadSpeaker 提供了一系列强大的文本转语音解决方案,可在任何环境中即时部署逼真、定制的语音交互。

podcast.ai

在 Play.ht,我们相信未来所有的内容创作都将由 AI 生成,但由人类指导,而最具创造性的工作将取决于人类将他们想要的创作表达给机器的能力。

Dubverse.ai

只需单击一个按钮,即可使您的内容支持多种语言,并覆盖更多人。

Dolly AI

Fork your voice in a flash

SO-VITS-SVC4.0

SO-VITS-SVC4.0详细安装、训练、推理使用步骤

iMyFone MagicMic

iMyFone Filme provides multiple voice editing tools to turn your powerful moment

TTS-vue

搬运请注明出处。

云蝠智能

优秀的AI对话能力OEM集成商

Relayed

Relayed是一款人工智能驱动的视频会议工具,旨在帮助团队克服远程工作、繁忙的日程安排和会议疲劳。它具有灵活的视频会议,异步对话,自动摘要,通过秘密链接和限制访问轻松共享,以及统一通信,并能够在以后重新访问和共享对话。

adobe.podcast

AI驱动的音频 增强语音通过消...

Open Voice OS

一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。

VALL-E

VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。

Synthesizer V

Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。

coqui.ai

在几秒钟内克隆您的声音或从我们可用的 AI 声音中进行选择,每个版本都会添加更多.

LiSTNR

Listnr是一个人工智能语音生成器和文本到语音的在线工具,允许用户从142种不同语言的900多个声音的文本创建逼真的画外音。

Resemble.ai

Resemble.ai的AI语音生成器是一个完整的生成式语音AI工具包,允许您在几秒钟内创建类似人类的声音。

第一页 · 上一页 · 下一页 · 当前第1页