阿里通义发布影视级 AI 配音大模型 Fun-CineForge 正式开源
2026 年 3 月 16 日,阿里通义实验室正式发布并开源Fun-CineForge,为业界首个面向影视级复杂场景的多模态 AI 配音大模型,同步开放 CineDub 数据集构建方法,以 “数据 + 模型” 一体化方案破解行业配音痛点。
核心亮点
首次引入时间模态,实现口型同步、情绪匹配、音色一致、时间精准对齐
支持独白、双人 / 多人对话,适配镜头切换、人脸遮挡等复杂影视场景
中文字错率低至0.94%,基于 CosyVoice3 语音合成底座
支持 30 秒内视频推理,模型与代码已在 GitHub、Hugging Face、ModelScope 三平台开源
该模型可广泛应用于影视译制、动画配音、游戏对白、短视频创作等场景,大幅降低专业配音制作门槛与成本。