agent-browser

6天前更新 4 0 0

AnyCoder 是基于 Gradio 构建的免费开源 AI 编程工具,主打直觉式开发,核心亮点就是用自然语言或图片生成前端代码,无需复杂配置,打开浏览器就能用,对零基础小白和效率党极度友好。

收录时间:
2026-04-09

最近在刷工具时,被Vercel Labs推出的Agent Browser彻底惊艳到了。这是一款专为AI代理设计的**浏览器自动化CLI工具**,核心目标就是解决传统浏览器自动化工具(如Playwright MCP)让LLM“淹没在海量DOM”里的痛点。

用一句话总结:Agent Browser 用极简文本输出 + 引用系统(refs),让AI代理以最低token成本,稳定、快速地完成网页导航、表单填写、数据提取、截图等操作。100%原生Rust实现,速度飞快,还支持多会话隔离认证,完全免费开源。

agent-browser

agent-browser 网站截图

为什么传统浏览器工具让AI头疼?

很多AI编码助手(如Claude Code、Cursor)在需要操作浏览器时,常用Playwright或Chrome DevTools Protocol。但问题来了:每次快照都要把整个DOM树塞进上下文,动辄几千甚至上万token。AI不仅容易“迷路”,token消耗还爆炸,成功率经常卡在70-80%。

Agent Browser 彻底颠覆了这个玩法。它不输出笨重的HTML/DOM,而是返回紧凑的文本 accessibility tree,并为每个可交互元素自动分配简洁的引用(ref),比如 @e1、@e2。AI只需记住这些ref,就能精准点击、输入,而不用反复解析复杂结构。

实测数据显示,在相同任务下,它的token消耗远低于传统方案,首次任务完成率可达95%左右,效率提升显著。

Agent Browser的核心特色

  1. Agent-First 设计,极致省Token 输出采用纯文本而非JSON,单个快照通常只需200-400 token(对比传统方案的3000-5000+)。专为LLM上下文优化,AI读起来自然、解析容易。支持-i标志,只捕获交互元素,进一步压缩输出。
  2. Ref-based 精准交互,确定性极高 agent-browser snapshot 命令返回带ref的页面快照,例如:
    text
    heading "Example Domain" [ref=e1]
    link "More information..." [ref=e2]

    然后直接用 agent-browser click @e2 操作。避免了传统选择器不稳定的问题,极大提升了代理的可靠性。

  3. 原生Rust,速度与性能拉满 采用客户端-守护进程(daemon)架构,daemon自动启动并持久运行,命令解析瞬间完成。跨平台支持(macOS、Linux、Windows),首次运行自动下载Chrome。相比JS实现的工具,启动和执行都更快。
  4. 功能完整,50+命令一应俱全
    • 导航、表单填写、滚动、截图(支持标注)
    • 网络监控、存储访问、JavaScript执行
    • 多会话管理(独立Cookie和认证)
    • 命令链式执行、diff对比、认证保险库(安全存储凭证) 还能无缝集成安全特性,防止提示注入和凭证泄露(均为opt-in)。
  5. 即插即用,与主流AI工具完美兼容 官方支持Claude Code、Cursor、GitHub Copilot、OpenAI Codex、Google Gemini 等任何能执行shell命令的代理。安装超级简单:
    text
    npm install -g agent-browser
    agent-browser install   # 下载Chrome

    或者直接 npx agent-browser open example.com 无需安装试用agent-browser

实际使用场景举例

假设你让AI代理完成“登录某个网站,搜索关键词,提取前3条结果并截图”:

传统方式:AI可能被DOM淹没,反复失败。 用Agent Browser:

  1. agent-browser open https://xxx.com
  2. agent-browser snapshot -i → 获取带ref的简洁视图
  3. agent-browser type @input “关键词”
  4. agent-browser click @search
  5. agent-browser snapshot → 提取数据
  6. agent-browser screenshot result.png

整个过程流畅,上下文干净,代理“思考”更清晰。开发者用它做自动化测试、数据采集、表单批量操作、AI Agent工作流时,效率提升明显。

此外,项目还提供了Skills功能,预置提示词教AI如何使用它,进一步降低集成门槛。Vercel还考虑了安全:凭证存储、导航限制等特性可选开启,适合生产级部署。

总结:AI浏览器自动化的新标杆

Agent Browser 不是简单替代Playwright,而是真正从AI代理视角重新设计的工具。它把“少即是多”的理念贯彻到底,用Rust性能 + 智能快照 + ref系统,解决了token浪费和不稳定性两大核心痛点。

无论你是构建自主AI Agent的工程师,还是用Cursor/Claude做自动化开发的开发者,都值得立刻试一试。

数据评估

agent-browser浏览人数已经达到4,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:agent-browser的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找agent-browser的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于agent-browser特别声明

本站3W导航提供的agent-browser都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由3W导航实际控制,在2026年4月9日 下午12:34收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,3W导航不承担任何责任。

相关导航

暂无评论

none
暂无评论...