--- name: browser-cdp description: "Use this skill when you need to control a Chrome browser via CDP (Chrome DevTools Protocol) to reuse existing login sessions. Covers: launching Chrome in debug mode, opening URLs, waiting for page load, evaluating JavaScript, taking snapshots, and extracting auth tokens. Trigger phrases: browser automation, CDP, agent-browser, 浏览器操作, 操作浏览器, Chrome CDP, 复用登录态, extract token from browser." metadata: openclaw: requires: bins: - agent-browser source: https://github.com/worldwonderer/oh-story-claudecode --- # Browser CDP 操作工具 通过 CDP 协议控制 Chrome,复用已有登录态,执行浏览器自动化操作。 ## 前置条件 - macOS / Linux / Windows(实验性),已安装 Google Chrome - Node.js 12+ - `agent-browser` 已安装:`npm install -g agent-browser` > ⚠️ **首次启动会 kill 用户的常规 Chrome。** 在启动前必须征求用户同意(见下方"启动流程"),否则用户可能丢失未保存的标签页/草稿。 --- ## 启动流程(skill-mode 强制步骤) **第一步:探测当前状态(无副作用)** ```bash node {SKILL_DIR}/scripts/setup-cdp-chrome.js 9222 --detect-only ``` 输出形如: ``` CDP_STATUS=ready # 已就绪,可直接复用 CDP_URL=http://127.0.0.1:9222/json/version BROWSER=Chrome/148.0.7778.168 ``` 或: ``` CDP_STATUS=needs-setup CHROME_RUNNING=yes # 用户有 Chrome 在跑,启动会杀掉 CHROME_PID_COUNT=3 ``` **第二步:根据探测结果分支** - `CDP_STATUS=ready` → 直接使用 `agent-browser --cdp 9222 ...`,**不要运行 setup**。 - `CDP_STATUS=needs-setup` 且 `CHROME_RUNNING=no` → 安全启动: ```bash node {SKILL_DIR}/scripts/setup-cdp-chrome.js 9222 --yes ``` - `CDP_STATUS=needs-setup` 且 `CHROME_RUNNING=yes` → **先用 AskUserQuestion 工具向用户确认**:告知会杀掉 N 个 Chrome 进程、可能丢失未保存工作;用户同意后再带 `--yes` 启动;用户拒绝则放弃这次自动化。 **为什么不能直接 `--yes`:** 脚本在非 TTY(即 skill 模式 / Bash 工具)下,如果检测到 Chrome 在跑而没有 `--yes`,会以退出码 3 报 `NEEDS_CONSENT: ...` 并中止,**不会**静默杀进程。这是有意的兜底——但 skill 流程仍应先问用户,而不是看到 3 就盲传 `--yes`。 --- ## 启动脚本选项 | 选项 | 说明 | |------|------| | `--detect-only` | 只探测,不修改任何状态(skill 用) | | `--yes` | 已征得同意,跳过交互提示 | | `--reset` | 启动前清空 `~/chrome-debug-profile`(登录失效时用) | | `--profile ` | 使用非 Default 的 Chrome profile(如 `"Profile 1"`) | | `--dry-run` | 打印将执行的步骤,不执行 | 退出码:`0` 成功 / `1` 通用错误 / `2` 用户拒绝(TTY)/ `3` 需同意但缺 `--yes`。 --- ## 常用操作 ### 打开页面并等待加载 ```bash agent-browser --cdp 9222 open "" agent-browser --cdp 9222 wait 3000 ``` ### 提取页面文本 ```bash agent-browser --cdp 9222 eval 'document.body.innerText.substring(0, 8000)' ``` ### 提取 Auth Token ```bash agent-browser --cdp 9222 eval 'localStorage.getItem("token") || document.cookie' ``` ### 复杂 JS(含引号 / `$` / 反引号) shell 转义容易出错,用以下两种方式之一: ```bash # 1) base64 包裹 agent-browser --cdp 9222 eval -b "$(echo -n "document.querySelectorAll('a').length" | base64)" # 2) heredoc + --stdin cat <<'EOF' | agent-browser --cdp 9222 eval --stdin const links = document.querySelectorAll('a'); links.length; EOF ``` ### 页面交互(snapshot 拿元素引用) ```bash agent-browser --cdp 9222 snapshot -i # 仅交互元素 agent-browser --cdp 9222 click "" agent-browser --cdp 9222 type "" "" ``` --- ## 停止 / 清理 - 关掉 debug Chrome 窗口即可(或 `pkill -9 -x 'Google Chrome'` / `taskkill /F /IM chrome.exe`)。 - 登录态失效:`node {SKILL_DIR}/scripts/setup-cdp-chrome.js 9222 --reset --yes`(注意 `--yes` 同样需要先问用户)。 --- ## 常见问题 | 问题 | 解决方案 | |------|----------| | `NEEDS_CONSENT` + 退出码 3 | 用 AskUserQuestion 询问用户是否允许杀掉 Chrome,同意后加 `--yes` 重跑 | | CDP 端口未监听 | `--detect-only` 再确认;端口被占用则换端口 | | 页面跳转到登录页 | `snapshot -i` 找登录按钮并操作 | | `eval` 返回 `null` | 检查 localStorage key 名;含引号的 JS 用 `eval -b` 或 `--stdin` | | 登录态过期 | `setup-cdp-chrome.js 9222 --reset --yes` 重新拷贝 | | 有多个 Chrome profile | `--profile "Profile 1"` 指定 | | Chrome 不会启动(30s 超时) | 试 `--reset`;检查端口冲突;查看 `~/chrome-debug-profile/` 是否损坏 |