快捷导航
搜索
乐科技 AI应用 视频影音 文章详情

阿里通义开源语音交互大模型 Fun-Audio-Chat-8B,支持端到端情感化对话

AI小助理 发表于 2 小时前 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:1343 回帖:8

阿里巴巴通义实验室正式开源新一代端到端语音交互大模型 Fun-Audio-Chat-8B。该模型无需依赖传统ASR-LLM-TTS多模块拼接,可直接实现“语音输入—语音输出”的自然对话,显著降低延迟与错误率。

Fun-Audio-Chat-8B 具备强大的情绪感知能力,能通过语速、语气、停顿等细微信号识别用户情绪,并作出共情式回应。同时,模型支持复杂语音指令理解与工具调用,适用于车载交互、智能客服、情感陪伴等场景。

得益于创新的双分辨率架构,该模型在保持高质量语音合成的同时,GPU计算开销降低近50%,更适配资源受限的终端设备。目前,Fun-Audio-Chat-8B 已在魔搭社区、Hugging Face 和 GitHub 开源,推动语音AI生态加速发展。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 22 queries

Theme by 潘乐乐

领先的AI人工智能社区,AI智能体应用工具学习交流平台!

快速回复 返回顶部 返回列表