如何用开源 Agent Browser 做安全浏览器自动化
浏览器自动化可以帮 AI 操作网页,但必须把只读、草稿、截图和人工发布边界写清楚。
浏览器自动化可以帮 AI 操作网页,但必须把只读、草稿、截图和人工发布边界写清楚。
- 栏目
- SOP
- 发布时间
- 2026-05-17
- 来源
- GitHub API:vercel-labs/agent-browser,约 33187 stars,Apache-2.0,https://github.com/vercel-labs/agent-browser
开源项目信息
- 仓库:vercel-labs/agent-browser
- 星标:检索时约 33187
- 许可证:Apache-2.0
- 地址:https://github.com/vercel-labs/agent-browser
这篇解决什么
让 Agent 操作浏览器很强,但也最容易出事:误点发布、误删内容、误改账号设置,或者处理验证码和敏感页面。
最终要得到的是:一套浏览器自动化安全 SOP:默认只读,草稿可写,发布必须人工确认。
适合谁
想用 AI 辅助操作公众号、小红书、微博、X、GitHub、后台系统的人。
操作步骤
1. 把动作分级:读取、填写、保存草稿、发布、删除、支付。
2. 默认只允许读取和保存草稿。
3. 每一步关键操作前后都截图或记录页面状态。
4. 遇到验证码、支付、删除、改权限时立即停下。
5. 稳定运行后再把单个平台流程写成专用 SOP。
可复制模板
平台:
允许动作:读取 / 填写 / 保存草稿
禁止动作:发布 / 删除 / 支付 / 改权限
证据:截图 / URL / 时间
人工确认点:
验收清单
- 是否默认禁止发布
- 是否有截图证据
- 是否能中断恢复
- 是否避免读取敏感信息
- 是否有人工确认点
如何集成进 Codex 能力
Codex 能力:浏览器自动化安全边界。
注意:高星不等于可以直接运行。HTKU 采用的是“学习开源项目的结构和流程”,先转成 SOP、Skill 或导航,再决定是否隔离测试代码。
标签
GitHubAgent Browser浏览器自动化安全SOP