谷歌DeepMind正式发布Gemini Robotics On-Device机器人模型
2025年6月25日,谷歌 DeepMind 正式发布 Gemini Robotics On-Device 模型,这是首个完全在机器人设备本地运行的视觉-语言-动作(VLA)AI 系统。该模型无需依赖云端连接,显著提升了机器人的自主性与灵活性。此前,许多机器人系统采用混合架构,将复杂任务交由云端处理,而 Gemini Robotics On-Device 实现了本地化推理,解决了隐私和安全问题。
Gemini Robotics On-Device 基于 Gemini 2.0 构建,具备强大的通用性、互动性和灵活性,能够理解新情境并执行精细的物理任务。该模型已在谷歌的双臂机器人 Aloha 2 上进行测试,并展示了其在自然语言指令执行、复杂操作(如折叠纸张、拉拉链)等方面的能力。
谷歌 DeepMind 表示,Gemini Robotics On-Device 是 Gemini 系列的最新成员,未来将结合 Gemini 2.5 的性能提升,进一步优化机器人能力。此次发布标志着谷歌在机器人 AI 领域迈出了重要一步,为下一代人形机器人奠定了基础。