Page Agent

2周前发布 13 0 0

Page Agent 是一个运行在浏览器页面中的 JavaScript GUI Agent,可以通过自然语言直接操作网页。

收录时间:
2026-05-09

什么是Page Agent

Page Agent(PageAgent.js)是一个JavaScript网页内GUI Agent,由阿里巴巴开源(MIT协议)。它能直接嵌入任何网页,让用户通过自然语言控制页面操作。无需浏览器扩展、无需Python后端、无需无头浏览器、无需截图OCR,一切都在当前网页内完成。

一行代码即可集成,把普通网站变成AI原生应用。用户输入“帮我填写这个表单”或“点击登录并跳转到订单页”,Agent就能自主执行。

Page Agent

Page Agent 网站截图

核心亮点

  • 极简集成:一个<script>标签或npm包即可嵌入,零基础设施。
  • 纯DOM操作:直接读取页面结构化文本(非视觉模型),准确率高、速度快、Token消耗低。
  • BYO LLM:支持自带任意大模型(OpenAI、Claude、Gemini、本地模型等),灵活性强。
  • 真实网页交互:点击、输入、滚动、导航等多步复杂操作,支持多页面任务(配合可选Chrome扩展)。
  • 隐私优先:所有操作在当前页面内完成,数据不离开用户浏览器。
  • 轻量高效:Bundle体积小,适合生产环境集成。

适用场景

  • SaaS产品:为用户提供自然语言操作 copilots,简化复杂工作流。
  • 企业内部系统:让ERP、CRM、OA等遗留系统支持语音或文字指令操作。
  • 无障碍访问:帮助残障用户通过自然语言使用网页。
  • 自动化测试与演示:快速生成操作流程。
  • 个人生产力:在任意网站快速完成重复性操作。
  • AI Agent开发:作为前端执行引擎,构建更强大的网页Agent。

如何快速上手

  1. 访问官网 体验在线Demo。
  2. 通过npm安装或直接引入CDN脚本。
  3. 初始化Agent并传入你的LLM API配置。
  4. 在页面任意位置添加操作入口,用户输入自然语言指令即可运行。
  5. 可选安装Chrome扩展,解锁跨页面和浏览器级任务。

整个集成过程通常只需几分钟,文档详尽,支持TypeScript。Page Agent

用户与社区反馈

项目上线后迅速获得关注,GitHub星数快速增长。开发者反馈:“集成太简单了,真正做到了开箱即用”“比传统自动化方案轻量太多”“自然语言控制网页的体验很丝滑”。适合前端开发者、产品团队和AI应用构建者。

总结

Page Agent 是阿里开源的又一力作,它把AI Agent从云端/后端拉到了网页前端,让自然语言控制网页变得前所未有的简单。一行代码就能为网站注入AI灵魂,极大降低了AI自动化门槛。

数据评估

Page Agent浏览人数已经达到13,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:Page Agent的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找Page Agent的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于Page Agent特别声明

本站3W导航提供的Page Agent都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由3W导航实际控制,在2026年5月9日 下午12:06收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,3W导航不承担任何责任。

相关导航

暂无评论

none
暂无评论...