
什么是Page Agent?
Page Agent(PageAgent.js)是一个纯JavaScript网页内GUI Agent,由阿里巴巴开源(MIT协议)。它能直接嵌入任何网页,让用户通过自然语言控制页面操作。无需浏览器扩展、无需Python后端、无需无头浏览器、无需截图OCR,一切都在当前网页内完成。
一行代码即可集成,把普通网站变成AI原生应用。用户输入“帮我填写这个表单”或“点击登录并跳转到订单页”,Agent就能自主执行。

Page Agent 网站截图
核心亮点
- 极简集成:一个<script>标签或npm包即可嵌入,零基础设施。
- 纯DOM操作:直接读取页面结构化文本(非视觉模型),准确率高、速度快、Token消耗低。
- BYO LLM:支持自带任意大模型(OpenAI、Claude、Gemini、本地模型等),灵活性强。
- 真实网页交互:点击、输入、滚动、导航等多步复杂操作,支持多页面任务(配合可选Chrome扩展)。
- 隐私优先:所有操作在当前页面内完成,数据不离开用户浏览器。
- 轻量高效:Bundle体积小,适合生产环境集成。
适用场景
- SaaS产品:为用户提供自然语言操作 copilots,简化复杂工作流。
- 企业内部系统:让ERP、CRM、OA等遗留系统支持语音或文字指令操作。
- 无障碍访问:帮助残障用户通过自然语言使用网页。
- 自动化测试与演示:快速生成操作流程。
- 个人生产力:在任意网站快速完成重复性操作。
- AI Agent开发:作为前端执行引擎,构建更强大的网页Agent。
如何快速上手
- 访问官网 体验在线Demo。
- 通过npm安装或直接引入CDN脚本。
- 初始化Agent并传入你的LLM API配置。
- 在页面任意位置添加操作入口,用户输入自然语言指令即可运行。
- 可选安装Chrome扩展,解锁跨页面和浏览器级任务。
整个集成过程通常只需几分钟,文档详尽,支持TypeScript。
用户与社区反馈
项目上线后迅速获得关注,GitHub星数快速增长。开发者反馈:“集成太简单了,真正做到了开箱即用”“比传统自动化方案轻量太多”“自然语言控制网页的体验很丝滑”。适合前端开发者、产品团队和AI应用构建者。
总结
Page Agent 是阿里开源的又一力作,它把AI Agent从云端/后端拉到了网页前端,让自然语言控制网页变得前所未有的简单。一行代码就能为网站注入AI灵魂,极大降低了AI自动化门槛。
数据评估
关于Page Agent特别声明
本站3W导航提供的Page Agent都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由3W导航实际控制,在2026年5月9日 下午12:06收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,3W导航不承担任何责任。
相关导航

AIVocal 是一款基于人工智能技术的在线语音处理平台。它不仅是一个简单的文字转语音工具,更是一个全方位的音频工作站。

CoPaw
CoPaw是一款以智能体技术为核心的桌面工具,它可以帮助用户在电脑上更高效地完成各种操作。

New API
承载所有 AI 应用,管理你的数字资产,连接未来的统一基础设施平台。

无限画
无限画是基于人工智能技术免费AI绘画和创作平台,提供的功能包含文生图、图生图、二次元头像生成等。

360鸿图
360鸿图是一款AI绘画工具,用户可以直接通过输入关键词,图片等直接生成想要的图片。

agent-browser
AnyCoder 是基于 Gradio 构建的免费开源 AI 编程工具,主打直觉式开发,核心亮点就是用自然语言或图片生成前端代码,无需复杂配置,打开浏览器就能用,对零基础小白和效率党极度友好。
鬼手剪辑
鬼手剪辑 GhostCut 是一款基于人工智能技术的专业视频处理与翻译译制平台。该平台专注于内容全球化出海,通过一站式 AI 视频译制工作台,解决视频制作中的语言翻译、字幕擦除、语音配音、音效处理等核心痛点。

NiceVoice
NiceVoice是一款零门槛在线 AI 声音克隆工具,上传 5–30 秒干净人声即可在几秒内生成高相似度语音模型,并可将任意文本秒级合成自然朗读音频,全程免费、无需注册、无水印导出 MP3/WAV。
暂无评论...
