谷歌DeepMind推出全新机器人模型,赋能机器人自主学习与网络搜索能力
2025年9月26日,北京讯 —— 谷歌 DeepMind 今日宣布推出其最新一代机器人人工智能模型,显著提升机器人在现实世界中的自主决策与任务执行能力。该系统基于升级版 Gemini Robotics 1.5 与 Gemini Robotics-ER 1.5 模型,首次实现机器人通过实时网络搜索获取信息,并据此动态规划和执行复杂物理任务。
据 DeepMind 机器人部门负责人 Carolina Parada 介绍,新模型使机器人不仅能理解环境、执行精细动作(如折叠衣物、分类垃圾),还能在面对未知任务时主动检索互联网资源,例如根据伦敦实时天气打包行李,或依据本地法规正确分类可回收物。这一能力标志着机器人从“执行指令”迈向“理解并解决实际问题”的关键跃迁。
技术核心在于构建“感知—检索—推理—执行”闭环:机器人通过视觉语言模型理解场景,调用网络搜索工具获取所需知识,再由动作生成模型转化为精准物理操作。实验显示,该系统在非标准任务中的完成准确率高达92%,较传统方法提升37%。
此外,新模型支持跨硬件技能迁移,已在 ALOHA、Franka 双臂机器人及 Apollo 人形机器人上成功验证。为保障安全,DeepMind 采用“AI管理AI”的分层控制架构,并延续其“机器人宪法”伦理框架。
目前,Gemini Robotics-ER 1.5 已通过 Google AI Studio 向开发者开放,Gemini Robotics 1.5 则面向合作伙伴提供预览。此举有望加速服务机器人、智能制造与家庭助理等领域的智能化进程,推动具身智能迈向新阶段。