gpt-realtime-1.5 by OpenAI

Name: gpt-realtime-1.5 by OpenAI
Brand: gpt-realtime-1.5 by OpenAI
Availability: InStock

提升语音 agent 的指令遵循能力

API 开发者工具人工智能

在 Product Hunt 查看访问官网

产品介绍

随着 Realtime API 引入 gpt-realtime-1.5，语音工作流能力显著增强。该模型在指令遵循、工具调用和多语言准确性方面提供了更高的可靠性。

适合谁关注

开发者和技术团队
创业者、投资人和财务团队
教育产品团队和学习工具用户
正在评估 AI 工具或智能体落地的团队

可借鉴场景

快速理解 gpt-realtime-1.5 by OpenAI 的定位、核心能力和 Product Hunt 热度
判断“提升语音 agent 的指令遵循能力”这类需求是否值得做竞品调研
沿着开发者工具、AI 与智能体继续发现同类产品和替代方案
筛选高票产品，观察海外用户当前愿意投票支持的产品形态

234

投票数

评论数

2月26日

发布日期

作者自荐

@OpenAI 团队发布了一个有趣的更新！ GPT-Realtime-1.5 是 OpenAI 面向语音 agent 和客户支持的旗舰级音频模型。随着 Realtime API 引入 gpt-realtime-1.5，语音工作流能力显著增强。该模型在指令遵循、工具调用和多语言准确性方面提供了更高的可靠性。在 Big Bench Audio 基准上提升 5%，以及在字母数字转录任务上实现两位数增长，这些并非表面改进，而是直接提升了生产环境语音系统的实际可靠性。从早期合作伙伴 @Genspark 和 @Sendbird 的结果来看，最突出的亮点包括：人工接通率提升至 66%（原为 43.7%）在已评分的对话中，97.9% 获得完美分数问题案例率减半对话完成度更高这些数据表明，模型在指令遵循、工具调用清晰度和话轮转换稳定性方面表现更佳，而这正是语音 agent 历来面临的挑战。低延迟、更强的打断处理能力以及改进的多语言准确性，使得此次更新更像是面向企业应用的基础设施成熟化，而非简单的演示升级。期待看到开发者基于此模型构建出更多应用。

总结

GPT-Realtime-1.5 是 OpenAI 针对实时语音交互场景推出的重要模型升级，标志着语音 AI 从"可用"向"可靠"的演进。其核心价值在于显著提升了语音 agent 在复杂、动态对话环境中的指令遵循精度和交互稳定性。从早期合作伙伴数据看，人工接通率大幅提升至 66%，问题案例率减半，这直接解决了语音客服、虚拟助手等场景中因误解指令、话轮混乱导致的用户体验下降和运营成本增加问题。模型在低延迟、打断处理和多语言准确性上的优化，使其更适用于对实时性要求高的企业级应用，如金融客服、医疗问诊、多语言支持中心等。此次升级不仅是性能指标的提升，更是 OpenAI 将 Realtime API 定位为企业级语音基础设施的关键一步，为开发者构建更复杂、更可靠的语音应用提供了坚实的技术底座。

GitMemo免费开源

把 AI 对话保存到你的 Git 知识库

本地优先，支持 macOS 与 Android。剪贴板、截图、笔记和文件都能集中保存、搜索、同步。

获取安装包