在2024年7月4日举行的世界人工智能大会(WAIC 2024)上,商汤科技展示了其开发的首个面向C端用户的可控人物视频生成大模型——Vimi。这款大模型的亮相引起了广泛关注,并成功入选了大会的“镇馆之宝”名单。
![]() Vimi的特点在于其高度的可控性,它能够通过一张任意风格的照片生成与目标动作一致的人物类视频。此外,Vimi还支持多种驱动方式,可以通过已有人物视频或图片进行驱动,实现精准的人物表情控制,并在半身区域内控制照片中人物的自然肢体变化。它甚至能够自动生成与人物相符的头发、服饰及背景变化,稳定生成1分钟的单镜头人物类视频。 商汤科技的Vimi大模型完全面向C端用户开放使用,这意味着普通消费者将能够利用这项技术生成个性化的视频内容,为视频创作和娱乐带来新的可能性。通过Vimi,用户可以轻松地将静态图片转化为动态视频,享受人工智能技术带来的便利和创新体验。 |