
最近在刷工具时,被Vercel Labs推出的Agent Browser彻底惊艳到了。这是一款专为AI代理设计的**浏览器自动化CLI工具**,核心目标就是解决传统浏览器自动化工具(如Playwright MCP)让LLM“淹没在海量DOM”里的痛点。
用一句话总结:Agent Browser 用极简文本输出 + 引用系统(refs),让AI代理以最低token成本,稳定、快速地完成网页导航、表单填写、数据提取、截图等操作。100%原生Rust实现,速度飞快,还支持多会话隔离认证,完全免费开源。

agent-browser 网站截图
为什么传统浏览器工具让AI头疼?
很多AI编码助手(如Claude Code、Cursor)在需要操作浏览器时,常用Playwright或Chrome DevTools Protocol。但问题来了:每次快照都要把整个DOM树塞进上下文,动辄几千甚至上万token。AI不仅容易“迷路”,token消耗还爆炸,成功率经常卡在70-80%。
Agent Browser 彻底颠覆了这个玩法。它不输出笨重的HTML/DOM,而是返回紧凑的文本 accessibility tree,并为每个可交互元素自动分配简洁的引用(ref),比如 @e1、@e2。AI只需记住这些ref,就能精准点击、输入,而不用反复解析复杂结构。
实测数据显示,在相同任务下,它的token消耗远低于传统方案,首次任务完成率可达95%左右,效率提升显著。
Agent Browser的核心特色
- Agent-First 设计,极致省Token 输出采用纯文本而非JSON,单个快照通常只需200-400 token(对比传统方案的3000-5000+)。专为LLM上下文优化,AI读起来自然、解析容易。支持-i标志,只捕获交互元素,进一步压缩输出。
- Ref-based 精准交互,确定性极高 agent-browser snapshot 命令返回带ref的页面快照,例如:
text
heading "Example Domain" [ref=e1] link "More information..." [ref=e2]然后直接用 agent-browser click @e2 操作。避免了传统选择器不稳定的问题,极大提升了代理的可靠性。
- 原生Rust,速度与性能拉满 采用客户端-守护进程(daemon)架构,daemon自动启动并持久运行,命令解析瞬间完成。跨平台支持(macOS、Linux、Windows),首次运行自动下载Chrome。相比JS实现的工具,启动和执行都更快。
- 功能完整,50+命令一应俱全
- 导航、表单填写、滚动、截图(支持标注)
- 网络监控、存储访问、JavaScript执行
- 多会话管理(独立Cookie和认证)
- 命令链式执行、diff对比、认证保险库(安全存储凭证) 还能无缝集成安全特性,防止提示注入和凭证泄露(均为opt-in)。
- 即插即用,与主流AI工具完美兼容 官方支持Claude Code、Cursor、GitHub Copilot、OpenAI Codex、Google Gemini 等任何能执行shell命令的代理。安装超级简单:
text
npm install -g agent-browser agent-browser install # 下载Chrome或者直接 npx agent-browser open example.com 无需安装试用

实际使用场景举例
假设你让AI代理完成“登录某个网站,搜索关键词,提取前3条结果并截图”:
传统方式:AI可能被DOM淹没,反复失败。 用Agent Browser:
- agent-browser open https://xxx.com
- agent-browser snapshot -i → 获取带ref的简洁视图
- agent-browser type @input “关键词”
- agent-browser click @search
- agent-browser snapshot → 提取数据
- agent-browser screenshot result.png
整个过程流畅,上下文干净,代理“思考”更清晰。开发者用它做自动化测试、数据采集、表单批量操作、AI Agent工作流时,效率提升明显。
此外,项目还提供了Skills功能,预置提示词教AI如何使用它,进一步降低集成门槛。Vercel还考虑了安全:凭证存储、导航限制等特性可选开启,适合生产级部署。
总结:AI浏览器自动化的新标杆
Agent Browser 不是简单替代Playwright,而是真正从AI代理视角重新设计的工具。它把“少即是多”的理念贯彻到底,用Rust性能 + 智能快照 + ref系统,解决了token浪费和不稳定性两大核心痛点。
无论你是构建自主AI Agent的工程师,还是用Cursor/Claude做自动化开发的开发者,都值得立刻试一试。
数据评估
本站3W导航提供的agent-browser都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由3W导航实际控制,在2026年4月9日 下午12:34收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,3W导航不承担任何责任。
相关导航


New API

CoPaw
9lnk.io

3MinTop

Stability AI

小鱼AI写作


