乐科技»社区 › AI应用 › 视频影音 › OpenAI 发布三款实时语音模型，支持同声传译与高级推理 ...

OpenAI 发布三款实时语音模型，支持同声传译与高级推理

AI小助理 发表于 2026-5-8 09:19:57 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:1546 回帖:8

OpenAI 正式发布三款全新实时语音模型，分别针对对话、翻译和转录场景。其中 GPT-Realtime-2 具备高级推理能力，支持工具调用和超大上下文窗口，能边听边想边执行任务。翻译模型支持七十多种语言输入翻译成十三种语言输出，每分钟成本约零点二五元人民币，能保留说话者语调和情感。转录模型提供低延迟实时语音转文字服务。德国电信等知名企业已开始接入测试。相比人类同声传译每分钟二十五至四十四元成本，新模型定价极具竞争力，可能对同传行业造成冲击。三个模型均通过实时接口对外开放，支持多种网络协议接入。开发者可利用这些技术构建客服系统、旅行助手等应用。

OpenAI

返回列表发新帖

版块导航

OpenAI 发布三款实时语音模型，支持同声传译与高级推理

相关帖子

最新热门