如何用开源 Agent Browser 做安全浏览器自动化

摘要

浏览器自动化可以帮 AI 操作网页，但必须把只读、草稿、截图和人工发布边界写清楚。

栏目: SOP
发布时间: 2026-05-17
来源: GitHub API：vercel-labs/agent-browser，约 33187 stars，Apache-2.0，https://github.com/vercel-labs/agent-browser

开源项目信息

让 Agent 操作浏览器很强，但也最容易出事：误点发布、误删内容、误改账号设置，或者处理验证码和敏感页面。

最终要得到的是：一套浏览器自动化安全 SOP：默认只读，草稿可写，发布必须人工确认。

想用 AI 辅助操作公众号、小红书、微博、X、GitHub、后台系统的人。

1. 把动作分级：读取、填写、保存草稿、发布、删除、支付。
2. 默认只允许读取和保存草稿。
3. 每一步关键操作前后都截图或记录页面状态。
4. 遇到验证码、支付、删除、改权限时立即停下。
5. 稳定运行后再把单个平台流程写成专用 SOP。

平台：
允许动作：读取 / 填写 / 保存草稿
禁止动作：发布 / 删除 / 支付 / 改权限
证据：截图 / URL / 时间
人工确认点：

Codex 能力：浏览器自动化安全边界。

注意：高星不等于可以直接运行。HTKU 采用的是“学习开源项目的结构和流程”，先转成 SOP、Skill 或导航，再决定是否隔离测试代码。