OpenAI 发布三款实时语音模型,支持同声传译与高级推理
OpenAI 正式发布三款全新实时语音模型,分别针对对话、翻译和转录场景。其中 GPT-Realtime-2 具备高级推理能力,支持工具调用和超大上下文窗口,能边听边想边执行任务。翻译模型支持七十多种语言输入翻译成十三种语言输出,每分钟成本约零点二五元人民币,能保留说话者语调和情感。转录模型提供低延迟实时语音转文字服务。德国电信等知名企业已开始接入测试。相比人类同声传译每分钟二十五至四十四元成本,新模型定价极具竞争力,可能对同传行业造成冲击。三个模型均通过实时接口对外开放,支持多种网络协议接入。开发者可利用这些技术构建客服系统、旅行助手等应用。
|
|
|
|
|
|
|
|