阿里推出全新语音模型“通义百聆”,开源模型下载量已超5.6亿
2025年9月24日,阿里巴巴在杭州云栖大会上正式发布全新语音大模型家族——通义百聆,涵盖语音识别模型 Fun-ASR 与语音合成模型 Fun-CosyVoice。
其中,Fun-CosyVoice3-0.5B 支持 zero-shot 音色克隆,仅需3秒以上参考音频即可复刻音色并合成新语音,适用于客服、直播电商、有声书等多场景,并支持本地部署与二次开发。配套推出的轻量化语音识别模型 Fun-ASR-Nano 参数量压缩至0.8B,显著降低推理成本,适配资源受限设备。
据官方披露,通义百聆系列开源模型上线以来,累计下载量已突破 5.6亿次,展现出强劲的开发者生态活力与行业应用潜力。此次发布标志着阿里在企业级语音AI领域迈出关键一步,推动全场景智能语音技术加速落地。