腾讯今日正式推出其自研视频生成大模型 HunyuanVideo 1.5,标志着其在多模态AI领域的重大升级。该模型可基于文本、图像或短视频输入,生成最高达8秒、分辨率达1080p的高质量动态视频,具备更强的动作连贯性、物理合理性与细节还原能力。
据腾讯介绍,HunyuanVideo 1.5 采用创新的时空联合建模架构,在运动逻辑、光影一致性及复杂场景理解方面显著提升,支持人物动作、自然现象、产品展示等多种应用场景。同时,模型已集成至腾讯广告、内容创作及社交平台生态,赋能创作者高效生产AI视频内容。
此次发布是腾讯“混元”大模型体系继语言、图像、3D之后在视频生成方向的关键突破。腾讯表示,HunyuanVideo 1.5 将逐步向企业客户开放API,并计划在未来版本中支持16秒以上长视频生成与多语言指令控制。
业内专家指出,随着头部科技公司加速布局视频生成赛道,AI驱动的视觉内容生产正进入实用化新阶段。