2025年12月26日 — 知名开源浏览器自动化项目 BrowserUse 正式推出其首款自研大语言模型 BU-30B-A3B-Preview,专为 Web Agent(网页智能体)场景设计,现已在 Hugging Face 全面开源。
该模型基于阿里云通义千问 Qwen3-VL-30B-A3B-Instruct 深度优化,采用混合专家(MoE)架构,总参数达300亿,推理时仅激活30亿参数,单张消费级 GPU 即可流畅运行。支持视觉与文本多模态输入,上下文长度高达32K tokens,能精准理解 DOM 结构与页面截图,实现点击、滚动、表单填写等高可靠交互操作。
官方测试显示,BU-30B-A3B-Preview 平均每步操作仅需1.2秒,1美元计算成本可完成约200个浏览器任务,性能与性价比远超主流商用方案。
模型权重及使用文档已开放下载:
https://huggingface.co/browser-use/bu-30b-a3b-preview
此举标志着 Web 自动化正式迈入“高效、低成本、本地可部署”的开源新阶段。