
专为真人头像说话视频打造的一站式入口

最新音频模型,实现实时语音对语音翻译

实时语音到语音翻译 API

为创作者、品牌和工作室打造的唇形同步 AI 配音工具

语音转文字——本地或云端,自由选择

完全本地化的 Mac 语音控制助手

快速、精准的语音转文字 API,专为生产级语音 agent 打造

用 SUN 生成音频内容并同步至 Spotify 音乐库

日常消息沟通,语音优先

最强语音 agent 现已可通过 API 调用

以最佳价格提供快速、准确的 STT 与 TTS API

支持自然语言语音指令的文本转语音 API

100% 本地私密 AI 语音转文字与会议记录工具

YouTube 视频,现在每个人都能听得清清楚楚

开源 48kHz 文本转语音模型,支持语音设计与克隆

为 Mac 带来真实的机械键盘打字音效

谷歌推出的离线优先 AI 听写应用,由 Gemma 驱动

开口即完成,语音驱动效率提升十倍

专为语音 Agent 打造的文本转语音引擎

敲开复活节彩蛋,生成AI语音

谷歌最具成本效益的视频生成模型

按需生成的个性化AI音频课程

开源语音识别领域的新标杆

让音频AI更自然、更可靠

具备真实感与表现力的多语言文本转语音模型

创作更长、结构可控的 AI 音乐曲目

观察与分析语音及会话 AI agent

Grok 文本转语音 API 现已开放使用

AI创作平台,为内容赋予生命力

真实富有表现力的AI语音

转录来自 1000 多个平台的音频与视频

实时理解带口音的语音

根据上下文自适应调整语调、时机与情感的AI语音助手

与AI共同制作人一起,将创意转化为音乐曲目

为所有电脑音频提供实时翻译叠加层

iOS 语音转文字应用,实时处理,隐私优先

将语音转化为精炼文字——随时随地。

支持任意角色与音色的自然对话式 AI

运行一对一用户引导通话的 AI

实时语音转文字,支持说话人分离

随处可用的悬浮麦克风,将语音实时转为文字

语音设计、克隆与97毫秒流式生成

开源的 WisprFlow 替代方案

macOS 菜单栏优先级音频切换工具

快速、富有表现力的开源文本转语音,内置原生水印

无限免费 AI 声音克隆,支持 MP3 + SRT 导出

用表情符号为节日问候赋予情感

通过文本、视觉或时间提示分割任何声音

AI 文本转语音阅读器

顶级音频、图像和视频模型现已集于一个平台

真正智能的 AI 语音听写工具

探索、测试和部署生产级语音模型

推进 1,600+ 语言的自动语音识别