谷歌 DeepMind 正式发布新一代通用人工智能智能体 SIMA 2(Scalable Instructable Multiworld Agent)。该系统深度融合 Gemini 2.5 Flash Lite 大模型,能够在复杂3D虚拟环境中理解自然语言指令、自主规划行动路径,并通过自我学习持续提升任务完成能力。
SIMA 2 已成功在《无人深空》《英灵神殿》《模拟山羊3》等多款开放世界游戏中验证其泛化能力。它不仅能执行“前往红色房屋”这类基础指令,还能理解抽象描述如“找一栋像熟透番茄颜色的房子”,并主动解释推理过程。此外,系统支持文本、语音、手绘草图乃至表情符号等多种输入形式,显著增强人机交互灵活性。
与前代相比,SIMA 2 的任务完成率从约31%跃升至62%以上,接近人类玩家水平。其核心突破在于引入“自生成数据循环”机制:进入新环境后,系统可自主设计任务、评估执行效果,并利用高质量轨迹进行迭代优化,无需依赖额外人工演示。
DeepMind 强调,游戏并非最终目标,而是训练通用智能的“理想沙盒”。SIMA 2 聚焦高层决策与环境理解,未来有望将所学能力迁移至现实世界的机器人系统。目前,该版本以研究预览形式向部分学术机构和开发者开放,旨在推动虚拟智能体向实体智能演进。