返回首页

音频

53 个产品

Avatars in ElevenCreative

Avatars in ElevenCreative

专为真人头像说话视频打造的一站式入口

音频视频
2026年6月13日
Gemini 3.5 Live Translate

Gemini 3.5 Live Translate

最新音频模型,实现实时语音对语音翻译

安卓语言音频
2026年6月10日
Krisp Voice Translation API

Krisp Voice Translation API

实时语音到语音翻译 API

API开发者工具音频
2026年6月9日
Vaani

Vaani

为创作者、品牌和工作室打造的唇形同步 AI 配音工具

生产力人工智能音频
2026年6月8日
Wave

Wave

语音转文字——本地或云端,自由选择

生产力GitHub音频
2026年6月7日
LocalClicky

LocalClicky

完全本地化的 Mac 语音控制助手

开源GitHub科技
2026年6月5日
Parrot Speech-to-text API

Parrot Speech-to-text API

快速、精准的语音转文字 API,专为生产级语音 agent 打造

API人工智能音频
2026年5月26日
SUN-to-Spotify

SUN-to-Spotify

用 SUN 生成音频内容并同步至 Spotify 音乐库

教育人工智能音频
2026年5月17日
Pop

Pop

日常消息沟通,语音优先

即时通讯音频
2026年5月9日
Grok Voice Think Fast 1.0

Grok Voice Think Fast 1.0

最强语音 agent 现已可通过 API 调用

API音频
2026年4月25日
Grok Voice API

Grok Voice API

以最佳价格提供快速、准确的 STT 与 TTS API

API人工智能音频
2026年4月18日
Google Gemini 3.1 Flash TTS

Google Gemini 3.1 Flash TTS

支持自然语言语音指令的文本转语音 API

API人工智能音频
2026年4月16日
Ghost Pepper 🌶️

Ghost Pepper 🌶️

100% 本地私密 AI 语音转文字与会议记录工具

开源隐私GitHub
2026年4月14日
Krisp Accent Converter for YouTube

Krisp Accent Converter for YouTube

YouTube 视频,现在每个人都能听得清清楚楚

Chrome 扩展生产力音频
2026年4月13日
VoxCPM2

VoxCPM2

开源 48kHz 文本转语音模型,支持语音设计与克隆

开源人工智能音频
2026年4月13日
Keeby

Keeby

为 Mac 带来真实的机械键盘打字音效

Mac生产力音频
2026年4月8日
Google AI Edge Eloquent

Google AI Edge Eloquent

谷歌推出的离线优先 AI 听写应用,由 Gemma 驱动

人工智能音频
2026年4月7日
VoiceOS

VoiceOS

开口即完成,语音驱动效率提升十倍

生产力音频
2026年4月3日
Lightning V3

Lightning V3

专为语音 Agent 打造的文本转语音引擎

语言人工智能音频
2026年4月2日
Noiz Easter Voice

Noiz Easter Voice

敲开复活节彩蛋,生成AI语音

表情符号人工智能音频
2026年4月1日
Google Veo 3.1 Lite

Google Veo 3.1 Lite

谷歌最具成本效益的视频生成模型

人工智能音频视频
2026年4月1日
SUN

SUN

按需生成的个性化AI音频课程

Android人工智能音频
2026年3月29日
Cohere Transcribe

Cohere Transcribe

开源语音识别领域的新标杆

开源人工智能音频
2026年3月28日
Gemini 3.1 Flash Live

Gemini 3.1 Flash Live

让音频AI更自然、更可靠

人工智能音频
2026年3月27日
Voxtral TTS by Mistral AI

Voxtral TTS by Mistral AI

具备真实感与表现力的多语言文本转语音模型

开发者工具人工智能音频
2026年3月27日
Lyria 3 Pro by Google Deepmind

Lyria 3 Pro by Google Deepmind

创作更长、结构可控的 AI 音乐曲目

音乐人工智能音频
2026年3月26日
Cekura

Cekura

观察与分析语音及会话 AI agent

SaaS开发者工具音频
2026年3月24日
Grok's Text to Speech API

Grok's Text to Speech API

Grok 文本转语音 API 现已开放使用

营销音频
2026年3月18日
ElevenCreative by ElevenLabs

ElevenCreative by ElevenLabs

AI创作平台,为内容赋予生命力

人工智能音频视频
2026年3月15日
Fish Audio S2

Fish Audio S2

真实富有表现力的AI语音

开源人工智能GitHub
2026年3月10日
Vocova

Vocova

转录来自 1000 多个平台的音频与视频

生产力人工智能音频
2026年3月4日
Krisp Accent Conversion

Krisp Accent Conversion

实时理解带口音的语音

生产力人工智能音频
2026年3月3日
Expressive Mode for ElevenAgents

Expressive Mode for ElevenAgents

根据上下文自适应调整语调、时机与情感的AI语音助手

客户沟通人工智能音频
2026年3月2日
Producer AI by Google Labs

Producer AI by Google Labs

与AI共同制作人一起,将创意转化为音乐曲目

音乐人工智能音频
2026年2月28日
Seagull

Seagull

为所有电脑音频提供实时翻译叠加层

语言音频视频
2026年2月23日
Voice Notes to Text - SotiTalk

Voice Notes to Text - SotiTalk

iOS 语音转文字应用,实时处理,隐私优先

iOS笔记音频
2026年2月22日
Monologue for iOS

Monologue for iOS

将语音转化为精炼文字——随时随地。

生产力人工智能音频
2026年2月19日
NVIDIA PersonaPlex

NVIDIA PersonaPlex

支持任意角色与音色的自然对话式 AI

开源人工智能GitHub
2026年2月16日
Obi

Obi

运行一对一用户引导通话的 AI

客户成功人工智能音频
2026年2月6日
Voxtral Transcribe 2 by Mistral

Voxtral Transcribe 2 by Mistral

实时语音转文字,支持说话人分离

Android开发者工具人工智能
2026年2月5日
Voice Anywhere

Voice Anywhere

随处可用的悬浮麦克风,将语音实时转为文字

生产力人工智能音频
2026年2月2日
Qwen3-TTS

Qwen3-TTS

语音设计、克隆与97毫秒流式生成

开源人工智能音频
2026年1月23日
Voquill

Voquill

开源的 WisprFlow 替代方案

开源写作GitHub
2026年1月13日
AudioPriorityBar

AudioPriorityBar

macOS 菜单栏优先级音频切换工具

GitHub菜单栏应用Apple
2025年12月30日
Chatterbox Turbo

Chatterbox Turbo

快速、富有表现力的开源文本转语音,内置原生水印

开源人工智能音频
2025年12月30日
VocalLab.ai

VocalLab.ai

无限免费 AI 声音克隆,支持 MP3 + SRT 导出

社交媒体人工智能音频
2025年12月26日
NOIZ AI

NOIZ AI

用表情符号为节日问候赋予情感

表情符号人工智能音频
2025年12月20日
SAM Audio

SAM Audio

通过文本、视觉或时间提示分割任何声音

开源人工智能音频
2025年12月19日
CastReader

CastReader

AI 文本转语音阅读器

用户体验图书音频
2025年12月7日
ElevenLabs Image & Video

ElevenLabs Image & Video

顶级音频、图像和视频模型现已集于一个平台

人工智能音频图像和视频
2025年11月19日
Typeless

Typeless

真正智能的 AI 语音听写工具

生产力人工智能音频
2025年11月18日
Hathora

Hathora

探索、测试和部署生产级语音模型

开发者工具人工智能音频
2025年11月12日
Omnilingual ASR

Omnilingual ASR

推进 1,600+ 语言的自动语音识别

开源人工智能音频
2025年11月11日
数据来源:Product Hunt·© 2026 P-Hunt Daily·KaKaCut 旗下产品· 联系:sahadev@foxmail.com·京ICP备2026010115号