2025年12月25日,清华大学 TSAIL 实验室联合生数科技正式开源全新视频生成加速框架 TurboDiffusion。该框架在几乎不损失画质的前提下,将主流扩散模型的视频生成推理速度提升 100 至 200 倍,标志着 AI 视频创作迈入“实时生成”新阶段。
TurboDiffusion 并非全新模型,而是一套高效推理优化系统,集成了三大核心技术:
SageAttention:支持 8 位低比特注意力计算,利用 Tensor Core 加速;
SLA(稀疏线性注意力):动态保留关键注意力连接,大幅降低计算负载;
rCM 时间步蒸馏:将传统百步采样压缩至仅需 3–4 步,同时保障视觉一致性。
实测数据显示,在单张 RTX 5090 显卡上:
5 秒 480P 视频生成时间从 184 秒缩短至 1.9 秒(提速约 97 倍);
720P 高分辨率 14B 模型视频生成从 1.2 小时降至 38 秒;
即使在 RTX 4090 等消费级显卡上,也能流畅运行大型模型。
项目已全面开源,提供量化版(适配消费级 GPU)与非量化版(适配 H100 等专业卡)模型权重,并附带完整训练脚本与硬件适配指南。
GitHub 地址:
https://github.com/thu-ml/TurboDiffusion
TurboDiffusion 的发布有望显著降低 AI 视频生成门槛,推动其在内容创作、互动娱乐和企业级批量生产等场景中的广泛应用。