--- title: "openai gpt realtime voice models qbitai" source_url: https://mp.weixin.qq.com/s/I5dRqYWogmgROkOusRtzTA tags: [wechat, article, claude, openai, gpt, agent, harness, openclaw] ingested: 2026-05-08 sha256: 21e2a2613a2c4ddc11cc9d7dc609f7b84a7ff0b4322bcb0e766407be15e559fb --- # GPT-5级推理能力塞进语音模型,OpenAI把同传翻译成本砍穿地板价 **作者:** 听雨(凹非寺 量子位) **发布:** 2026-05-08 ## 核心内容 OpenAI 上新三款实时语音模型,不仅集成了 GPT-5 级的推理能力,还对同传行业形成了冲击: **三款模型:** - **GPT-Realtime-2**:端到端语音推理,GPT-5 级推理能力,可实时语音对话 - **GPT-Realtime-Translate**:70+ 语言实时翻译成 13 种语言输出,每分钟约 $0.25(两毛五) - **GPT-Realtime-Whisper**:流式转写 **应用案例:** 1. 实时同声传译(英语 → 日语),流式输出,无需等说完一整句 2. 全程语音驱动生成 PRD 文档(Claire Vo 使用 ChatPRD + GPT-Realtime-2) 3. 语音指挥 AI 操控浏览器(Ben Badejo + OpenClaw):"打开Google,跳转到华尔街日报",AI 边执行边汇报进度 **对同传行业的影响:** 每分钟两毛五的实时翻译,对人类同声传译行业形成显著成本压力。 **技术亮点:** 端到端推理语音、同声传译、流式转写三件事打包进同一套 API。 --- *评审:Value 7/10 × Confidence 8/10 = 56 | ★★★★ | 推荐入库*