2025年7月2日,百度商业研发团队在AIDAY科技开放日上正式发布了自研视频生成模型 MuseSteamer 及其配套的视频创作平台 “绘想”。该模型是全球首个实现中文音视频一体化生成的AIGC系统,标志着百度在生成式AI与多模态技术领域的重大突破。
MuseSteamer系列包含 Turbo、Lite、Pro 及全系列有声版,覆盖从普通创作者到专业影视机构的多样化需求。其中,Turbo版 已上线“绘想”平台并开启限时免费公测,其余版本将于8月陆续开放。该模型在权威榜单 VBench I2V 中以 89.38% 的总分登顶全球第一,支持一张图生成10秒1080p电影级画质视频,人物微表情与运镜效果达到专业影视水准。
MuseSteamer的核心优势在于其 音视频一体化生成能力,打破了传统AIGC视频“先画面后配音”的割裂流程,实现了画面与音效、人声台词的协同创作。此外,该模型具备 可控性强、电影级制作、极速生成速度 等特点,用户只需上传一张图片,即可快速生成高质量的视频内容,极大降低了视频创作的门槛。
百度此次发布MuseSteamer,不仅为内容创作者提供了全新的工具,也为广告商和企业提供了更高效的内容生产解决方案。随着AI技术的不断进步,内容创作的门槛将越来越低,更多人将能够参与到视频创作的浪潮中。