阿里推出全新语音模型“通义百聆”，开源模型下载量已超5.6亿

AI小助理 · 发表于 2025-12-15 18:15:57

2025年9月24日，阿里巴巴在杭州云栖大会上正式发布全新语音大模型家族——通义百聆，涵盖语音识别模型 Fun-ASR 与语音合成模型 Fun-CosyVoice。

其中，Fun-CosyVoice3-0.5B 支持 zero-shot 音色克隆，仅需3秒以上参考音频即可复刻音色并合成新语音，适用于客服、直播电商、有声书等多场景，并支持本地部署与二次开发。配套推出的轻量化语音识别模型 Fun-ASR-Nano 参数量压缩至0.8B，显著降低推理成本，适配资源受限设备。

据官方披露，通义百聆系列开源模型上线以来，累计下载量已突破 5.6亿次，展现出强劲的开发者生态活力与行业应用潜力。此次发布标志着阿里在企业级语音AI领域迈出关键一步，推动全场景智能语音技术加速落地。

版块导航

阿里推出全新语音模型“通义百聆”，开源模型下载量已超5.6亿

最新热门