捷通华声—人工智能技术与服务提供商

“灵云科技 源自清华 服务全球”的发展战略

LipDub

用人工智能在几秒钟内说任何语言

Whisper

Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练

Relayed

Relayed是一款人工智能驱动的视频会议工具,旨在帮助团队克服远程工作、繁忙的日程安排和会议疲劳。它具有灵活的视频会议,异步对话,自动摘要,通过秘密链接和限制访问轻松共享,以及统一通信,并能够在以后重新访问和共享对话。

Nuance

Nuance是一家语音识别、自然...

讯飞听见

在线语音转文字,录音转文字

Open Voice OS

一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。

Musico

Musico 是一个人工智能驱动的软件引擎,可以生成音乐。它可以对手势、动作、代码或其他声音做出反应。

Harmonai

我们是一个社区驱动的组织,发布开源生成音频工具,让每个人都能更轻松、更有趣地制作音乐

SPLASH

将音乐制作的乐趣带给每个人。

Endel.io

可帮助您集中注意力、放松身心和入睡。以神经科学为后盾。

INFINITE ALBUM

适合游戏玩家的自适应 AI 音乐

Natural Language Playlist

Natural Language Playlist 探索语言和音乐之间丰富而复杂的关系,并使用 Transformer 语言模型构建播放列表。由于没有更好的术语,音乐推荐是一种“闭门造车”的东西。

Songtell

Songtell是第一个人工智能生成的歌曲含义库,生成了超过20000首歌曲的含义。你也可以订购一张印有你最喜欢的歌曲含义的海报。

Emergent Drums

使用Emergent Drums人工智能生成独特的鼓样本,使用Audialab插件生成无限的鼓样本,全部免版税。

SoundRaw AI

面向创作者的 AI 音乐生成器,只需选择情绪、流派和长度,SoundRaw AI就能为你生成优美的歌曲。

Getsound

Getsound基于当前天气条件的个性化音景。可用于水疗中心、酒店、度假村和工作场所。使用24/7天气监测和物理环境参数,该应用程序创建不断变化且独特的音景。 还提供了20多个音景,如日出,日落,沙漠,丛林,海洋,风和雨。

Mubert

人类×人工智能生成音乐,对于您的视频内容、播客和应用程序

Audiocraft/MusicGen

一个简单而可控的音乐生成LM,具有文本和旋律调节。

BeatBot

AI Song Maker 即刻创作属于你的AI音乐

DeepMusic

为音乐行业提供新的体验和方案

Play.ht

Play.ht AI驱动的语音生成器和逼真的文本到语音(TTS)音频转换器使用在线AI语音生成器和最佳合成声音,以MP3和WAV格式立即创建自然的、专业质量的音频。为视频、电子学习课程、播客、IVR系统等创建自定义画外音,支持超过132种语言和口音,并完全支持SSML。

VALL-E

VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。

Text-To-Song

将文本转换成歌曲的工具。它使用自然语言处理将文本输入转换为音频组合。该工具允许用户从各种音乐风格和乐器中进行选择,以及调整节奏、键和动态等参数。生成的音轨可以导出为高质量的音频文件。

MURF.AI

在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示

Uberduck

Uberduck是一个开源的语音AI社区,可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音,并使用他们的AI生成的说唱工具创建自己的自定义语音克隆。

Verbatik

Verbatik是一款由人工智能驱动的文本到语音生成器,提供了一个不断增长的库,包含142种语言和口音的600多种自然声音。

Eleven Labs

Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。

SpeechEasy

SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单直观,采用隐私优先的方法来保护用户信息。

Quickie

Quickie是一个人工智能驱动的扩展,允许用户生成文本转语音、摘要器、扩展器、推特、歌词和其他功能。它还提供自定义快捷方式,允许用户使用提示和输入建立自己的快捷方式。Quickie是免费的,每个学分1个Quickie,有无限的Quickie付费计划,保存的结果,和无限的自定义Quickie。

AiSofiya

Sofiya是一款由人工智能驱动的文本到语音转换器,可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率,并有一个强大的声音工作室,以合并和增强音频效果。它是一款多功能工具,可用于客户服务聊天机器人、语音助手、教育聊天机器人、用于自然语言处理任务的文本生成等。

Blogcast™

BlogcastTM是一个文本转语音的工具,允许用户创建播客、视频、电子学习课程的音频和音频书籍,而无需录制。它由人工智能驱动的文本转语音技术提供支持,并提供多种声音和语言可供选择。该工具还提供托管、播客订阅、媒体播放器、WordPress插件,以及与RSS订阅同步的功能。

呱呱有声-制作平台

长音频内容生产AIGC开放平台

Dubbing大饼AI声音

大饼AI变声器,自然人声效果,千种音色选择,全场景接入支持

Rask.ai

为您提供翻译和配音视频的机会

Text To Speech

构建自然说话的应用和服务,从 147 种语言和变体中选择 456 种语音

MotionSound

AI智能生成语音技术,简单易用的文本转语音工具,能适应多场景需求,配音、演讲不再有烦恼

phenaki

phenaki一种从文本生成视频的模型,提示可以随时间变化,视频可以长达数分钟。

zeroscope_v2_XL

管道标签不在官方列表中

Swapface人脸交换

Swapface是一款人工智能工具,允许用户实时创建逼真的人脸交换。它可以用于流媒体、视频通话和娱乐应用程序。该工具使用简单、私密、性价比高、省时。

换脸科技

换脸科技专注人像领域技术研发

Swap AI

Swap AI不限制并发,免费体验,一键化处理

第一页 · 上一页 · 下一页 · 当前第28页