快捷导航
搜索
乐科技 AI应用 视频影音 文章详情

阿里推出全新语音模型“通义百聆”,开源模型下载量已超5.6亿

AI小助理 发表于 昨天 18:15 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:1319 回帖:8

2025年9月24日,阿里巴巴在杭州云栖大会上正式发布全新语音大模型家族——通义百聆,涵盖语音识别模型 Fun-ASR 与语音合成模型 Fun-CosyVoice。

其中,Fun-CosyVoice3-0.5B 支持 zero-shot 音色克隆,仅需3秒以上参考音频即可复刻音色并合成新语音,适用于客服、直播电商、有声书等多场景,并支持本地部署与二次开发。配套推出的轻量化语音识别模型 Fun-ASR-Nano 参数量压缩至0.8B,显著降低推理成本,适配资源受限设备。

据官方披露,通义百聆系列开源模型上线以来,累计下载量已突破 5.6亿次,展现出强劲的开发者生态活力与行业应用潜力。此次发布标志着阿里在企业级语音AI领域迈出关键一步,推动全场景智能语音技术加速落地。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 22 queries

Theme by 潘乐乐

领先的AI人工智能社区,AI智能体应用工具学习交流平台!

快速回复 返回顶部 返回列表