音频

共 53 个产品

Avatars in ElevenCreative

专为真人头像说话视频打造的一站式入口

音频视频

2026年6月13日

Gemini 3.5 Live Translate

最新音频模型，实现实时语音对语音翻译

安卓语言音频

2026年6月10日

Krisp Voice Translation API

实时语音到语音翻译 API

API开发者工具音频

2026年6月9日

Vaani

为创作者、品牌和工作室打造的唇形同步 AI 配音工具

生产力人工智能音频

2026年6月8日

Wave

语音转文字——本地或云端，自由选择

生产力GitHub音频

2026年6月7日

LocalClicky

完全本地化的 Mac 语音控制助手

开源GitHub科技

2026年6月5日

Parrot Speech-to-text API

快速、精准的语音转文字 API，专为生产级语音 agent 打造

API人工智能音频

2026年5月26日

SUN-to-Spotify

用 SUN 生成音频内容并同步至 Spotify 音乐库

教育人工智能音频

2026年5月17日

Pop

日常消息沟通，语音优先

即时通讯音频

2026年5月9日

Grok Voice Think Fast 1.0

最强语音 agent 现已可通过 API 调用

API音频

2026年4月25日

Grok Voice API

以最佳价格提供快速、准确的 STT 与 TTS API

API人工智能音频

2026年4月18日

Google Gemini 3.1 Flash TTS

支持自然语言语音指令的文本转语音 API

API人工智能音频

2026年4月16日

Ghost Pepper 🌶️

100% 本地私密 AI 语音转文字与会议记录工具

开源隐私GitHub

2026年4月14日

Krisp Accent Converter for YouTube

YouTube 视频，现在每个人都能听得清清楚楚

Chrome 扩展生产力音频

2026年4月13日

VoxCPM2

开源 48kHz 文本转语音模型，支持语音设计与克隆

开源人工智能音频

2026年4月13日

Keeby

为 Mac 带来真实的机械键盘打字音效

Mac生产力音频

2026年4月8日

Google AI Edge Eloquent

谷歌推出的离线优先 AI 听写应用，由 Gemma 驱动

人工智能音频

2026年4月7日

VoiceOS

开口即完成，语音驱动效率提升十倍

生产力音频

2026年4月3日

Lightning V3

专为语音 Agent 打造的文本转语音引擎

语言人工智能音频

2026年4月2日

Noiz Easter Voice

敲开复活节彩蛋，生成AI语音

表情符号人工智能音频

2026年4月1日

Google Veo 3.1 Lite

谷歌最具成本效益的视频生成模型

人工智能音频视频

2026年4月1日

SUN

按需生成的个性化AI音频课程

Android人工智能音频

2026年3月29日

Cohere Transcribe

开源语音识别领域的新标杆

开源人工智能音频

2026年3月28日

Gemini 3.1 Flash Live

让音频AI更自然、更可靠

人工智能音频

2026年3月27日

Voxtral TTS by Mistral AI

具备真实感与表现力的多语言文本转语音模型

开发者工具人工智能音频

2026年3月27日

Lyria 3 Pro by Google Deepmind

创作更长、结构可控的 AI 音乐曲目

音乐人工智能音频

2026年3月26日

Cekura

观察与分析语音及会话 AI agent

SaaS开发者工具音频

2026年3月24日

Grok's Text to Speech API

Grok 文本转语音 API 现已开放使用

营销音频

2026年3月18日

ElevenCreative by ElevenLabs

AI创作平台，为内容赋予生命力

人工智能音频视频

2026年3月15日

Fish Audio S2

真实富有表现力的AI语音

开源人工智能GitHub

2026年3月10日

Vocova

转录来自 1000 多个平台的音频与视频

生产力人工智能音频

2026年3月4日

Krisp Accent Conversion

实时理解带口音的语音

生产力人工智能音频

2026年3月3日

Expressive Mode for ElevenAgents

根据上下文自适应调整语调、时机与情感的AI语音助手

客户沟通人工智能音频

2026年3月2日

Producer AI by Google Labs

与AI共同制作人一起，将创意转化为音乐曲目

音乐人工智能音频

2026年2月28日

Seagull

为所有电脑音频提供实时翻译叠加层

语言音频视频

2026年2月23日

Voice Notes to Text - SotiTalk

iOS 语音转文字应用，实时处理，隐私优先

iOS笔记音频

2026年2月22日

Monologue for iOS

将语音转化为精炼文字——随时随地。

生产力人工智能音频

2026年2月19日

NVIDIA PersonaPlex

支持任意角色与音色的自然对话式 AI

开源人工智能GitHub

2026年2月16日

Obi

运行一对一用户引导通话的 AI

客户成功人工智能音频

2026年2月6日

Voxtral Transcribe 2 by Mistral

实时语音转文字，支持说话人分离

Android开发者工具人工智能

2026年2月5日

Voice Anywhere

随处可用的悬浮麦克风，将语音实时转为文字

生产力人工智能音频

2026年2月2日

Qwen3-TTS

语音设计、克隆与97毫秒流式生成

开源人工智能音频

2026年1月23日

Voquill

开源的 WisprFlow 替代方案

开源写作GitHub

2026年1月13日

AudioPriorityBar

macOS 菜单栏优先级音频切换工具

GitHub菜单栏应用Apple

2025年12月30日

Chatterbox Turbo

快速、富有表现力的开源文本转语音，内置原生水印

开源人工智能音频

2025年12月30日

VocalLab.ai

无限免费 AI 声音克隆，支持 MP3 + SRT 导出

社交媒体人工智能音频

2025年12月26日

NOIZ AI

用表情符号为节日问候赋予情感

表情符号人工智能音频

2025年12月20日

SAM Audio

通过文本、视觉或时间提示分割任何声音

开源人工智能音频

2025年12月19日

CastReader

AI 文本转语音阅读器

用户体验图书音频

2025年12月7日

ElevenLabs Image & Video

顶级音频、图像和视频模型现已集于一个平台

人工智能音频图像和视频

2025年11月19日

Typeless

真正智能的 AI 语音听写工具

生产力人工智能音频

2025年11月18日

Hathora

探索、测试和部署生产级语音模型

开发者工具人工智能音频

2025年11月12日

Omnilingual ASR

推进 1,600+ 语言的自动语音识别

开源人工智能音频

2025年11月11日