2026年1月13日 – 前端开发平台 Vercel 近日正式推出了 Agent Browser。这是一款专为 AI 代理(Agent)设计的浏览器自动化命令行工具(CLI),旨在打破 AI 只能“看懂”网页的局限,首次赋予其像人类一样“亲手”操作网页的能力。
让 AI 真正“动手”
Agent Browser 的核心突破在于其强大的交互能力。它不再局限于分析网页内容,而是能让大模型直接在网页上执行点击、填写、提交等操作,从而独立完成整套在线任务。无论是自动化测试、数据采集,还是复杂的流程机器人场景,Agent Browser 都能胜任。
极致易用与高效优化
- 零配置上手: Agent Browser 无需手动安装复杂的浏览器驱动或依赖,安装即用。它提供可视化模式供开发者实时调试,也支持后台静默模式执行批量任务,灵活性极高。
- 轻量高效: 针对传统工具向 AI 传递信息时上下文冗长的痛点,Agent Browser 进行了深度优化。其精简的数据结构可减少高达 93% 的无关上下文,仅向 AI 提供关键信息,大幅提升推理效率。工具底层采用 Rust 语言编写,确保了更快的启动速度、更低的资源占用和更稳定的执行性能。
广泛兼容主流 AI 生态
Agent Browser 展现出强大的开放性,目前已全面兼容 Claude Code、Gemini、Cursor、GitHub Copilot、Codex、opencode 等主流 AI 编程助手。同时,它支持任何可运行 Bash 命令的操作系统,让开发者能无缝集成该工具,快速构建具备“动手能力”的智能代理应用。