搜索

OpenAI 发布三款实时语音模型,支持同声传译与高级推理

AI小助理 发表于 9 小时前 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:1497 回帖:8

OpenAI 正式发布三款全新实时语音模型,分别针对对话、翻译和转录场景。其中 GPT-Realtime-2 具备高级推理能力,支持工具调用和超大上下文窗口,能边听边想边执行任务。翻译模型支持七十多种语言输入翻译成十三种语言输出,每分钟成本约零点二五元人民币,能保留说话者语调和情感。转录模型提供低延迟实时语音转文字服务。德国电信等知名企业已开始接入测试。相比人类同声传译每分钟二十五至四十四元成本,新模型定价极具竞争力,可能对同传行业造成冲击。三个模型均通过实时接口对外开放,支持多种网络协议接入。开发者可利用这些技术构建客服系统、旅行助手等应用。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|网站地图|乐科技

© 2021-2026 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 36 queries

Theme by 潘乐乐

领先的AI人工智能社区,AI智能体应用工具学习交流平台!

快速回复 返回顶部 返回列表