logo
0
0
WeChat Login
Simon<10131203+gaomeng1900@users.noreply.github.com>
refactor(setup): consolidate prettier config and streamline CI

Page Agent

Page Agent Banner

License: MIT TypeScript Bundle Size Downloads GitHub stars

纯 JS 实现的 GUI agent。使用自然语言操作你的 Web 应用。无须后端、客户端、浏览器插件。

🌐 English | 中文

🚀 Demo | 📖 Docs | 📢 HN Discussion | 𝕏 Follow on X


✨ Features

  • 🎯 轻松集成
    • 无需 浏览器插件 / Python / 无头浏览器,纯页面内 JavaScript
  • 📖 基于文本的 DOM 操作
    • 无需截图,无需多模态模型或特殊权限
  • 🧠 自备 LLM
  • 🐙 可选的 Chrome 扩展,支持跨页面任务

💡 应用场景

  • SaaS AI Copilot — 几行代码为你的产品加上 AI 副驾驶,无需重写后端。
  • 智能表单填写 — 把 20 次点击变成一句话。ERP、CRM、管理后台的最佳拍档。
  • 无障碍增强 — 用自然语言让任何网页无障碍。语音指令、屏幕阅读器,零门槛。
  • 跨页面 Agent — 通过可选的 Chrome 扩展,让你自己的 Web Agent 跨标签页工作。
  • 通过 MCP 为现有 Agent 加入浏览器控制能力。

🚀 快速开始

一行代码集成

通过我们免费的 Demo LLM 快速体验 PageAgent:

<script src="{URL}" crossorigin="true"></script>

⚠️ 仅用于技术评估。 该 Demo CDN 使用了免费的测试 LLM API,使用即表示您同意其条款

MirrorsURL
Globalhttps://cdn.jsdelivr.net/npm/page-agent@1.8.0/dist/iife/page-agent.demo.js
Chinahttps://registry.npmmirror.com/page-agent/1.8.0/files/dist/iife/page-agent.demo.js

NPM 安装

npm install page-agent
import { PageAgent } from 'page-agent' const agent = new PageAgent({ model: 'qwen3.5-plus', baseURL: 'https://dashscope.aliyuncs.com/compatible-mode/v1', apiKey: 'YOUR_API_KEY', language: 'zh-CN', }) await agent.execute('点击登录按钮')

更多编程用法,请参阅 📖 文档

🤝 贡献

欢迎社区贡献!请参阅 CONTRIBUTING.md 了解安装与贡献指南。

提交 issue 或 PR 之前,请先阅读作者声明行为准则

我们不接受未经实质性人类参与、完全由 Bot 或 Agent 自动生成的代码。

👏 声明与致谢

本项目基于 browser-use 的优秀工作构建。

PageAgent 专为客户端网页增强设计,不是服务端自动化工具。

DOM processing components and prompt are derived from browser-use: Browser Use <https://github.com/browser-use/browser-use> Copyright (c) 2024 Gregor Zunic Licensed under the MIT License We gratefully acknowledge the browser-use project and its contributors for their excellent work on web automation and DOM interaction patterns that helped make this project possible.

⚖️ 许可证

MIT License


⭐ 如果觉得 PageAgent 有用或有趣,请给项目点个星!