Bilibili发布AniSora V3,动漫视频生成技术再升级
2025年7月2日,Bilibili(B站)宣布其开源动漫视频生成模型 AniSora 正式推出 V3版本。该版本在原有基础上大幅提升了生成质量、动作流畅度和风格多样性,为动漫、漫画及VTuber内容创作者提供了更强大的工具。
技术亮点:
强化学习与人类反馈(RLHF) :结合最新技术,提升视频的视觉质量和动作一致性。
时空掩码模块优化:支持更复杂的动画任务,如精细表情控制、动态镜头移动和局部图像引导生成。
数据集扩展:基于1000万高质量动漫视频片段训练,新增数据清洗流程,确保风格一致性和细节丰富度。
硬件优化:支持华为Ascend 910B NPU,推理速度提升约20%,4秒高清视频仅需2-3分钟。
多任务学习:支持单帧生成视频、关键帧插值、唇部同步等功能,适用于漫画改编和VTuber内容创作。
开源与社区:
AniSora V3的完整代码和模型权重已开源,开发者可通过GitHub和Hugging Face访问。Bilibili强调,AniSora是“对动漫世界的开源礼物”,鼓励社区协作优化模型。V3还引入了首个针对动漫视频生成的RLHF框架,进一步提升模型与人类审美的一致性。
应用场景广泛:
单图转视频:上传动漫图像并添加文本提示,即可生成动态视频。
漫画改编:从漫画帧生成带动作和唇部同步的动画,适合制作预告片或短篇动画。
VTuber与游戏:支持实时生成角色动画,助力独立创作者和游戏开发者快速测试角色动作。
高分辨率输出:支持1080p视频,适用于社交媒体和流媒体平台。
市场定位:
AniSora V3专注于2D/2.5D动漫风格,填补了市场空白,相比OpenAI的Sora或Kling等通用模型更具针对性。其发布进一步降低了动漫创作门槛,使独立创作者和小型团队能够以低成本实现高质量动画制作。