--- name: feishu-cli-read description: >- 只读操作，不修改文档内容。读取飞书云文档、知识库内容或电子表格，分析文档结构。支持普通 docx、普通 sheet、知识库 docx 和知识库 sheet。当用户请求"查看"、"阅读"、"分析"、"读取"、 "打开"、"read"、"view" 飞书文档、知识库或电子表格时使用。支持通过文档 ID、知识库 Token 或 URL 读取。 Markdown 仅作为分析中间态存放在 /tmp（不主动落地为用户文件）；如需主动导出到本地路径请用 feishu-cli-export，写入请用 feishu-cli-write。 argument-hint: user-invocable: true allowed-tools: Bash(feishu-cli doc:*), Bash(feishu-cli wiki:*), Bash(feishu-cli sheet:*), Bash(feishu-cli auth:*), Read, Grep --- # 飞书文档阅读技能从飞书云文档、电子表格或知识库读取内容，转换为 Markdown 格式后进行分析和展示。普通电子表格使用 `sheet export --format markdown`，知识库 sheet 使用 `wiki export`。 ## 前置条件 - **feishu-cli**：如尚未安装，请前往 [riba2534/feishu-cli](https://github.com/riba2534/feishu-cli) 获取安装方式 - 已完成认证（`feishu-cli auth login`） - App 权限：需要 `docx:document` 或 `docx:document:readonly`（普通文档）、`wiki:wiki:readonly`（知识库） - **Token 解析（所有读命令通用）**：`doc export` / `wiki export` / `sheet export` 等读类命令统一走"User 优先 + Tenant 兜底"——优先用 token.json 里的 User Token，未找到回落 App Token。所以读他人文档时只要 `auth login` 一次，后续不用再传 `--user-access-token`。详见下方"User Token 优先级链"小节。 ## 核心概念 **Markdown 作为中间态**：本地文档与飞书云文档之间通过 Markdown 格式进行转换，中间文件存储在 `/tmp` 目录中。 ## 使用方法 ```bash feishu-cli doc export --output /tmp/feishu_doc.md --download-images --assets-dir /tmp/feishu_assets feishu-cli wiki export --output /tmp/feishu_wiki.md --download-images --assets-dir /tmp/feishu_assets feishu-cli sheet export --format markdown --output /tmp/feishu_sheet.md ``` ## 获取文档元信息（doc get）读取文档基本信息（document_id、revision_id、title），用于在 export 之前确认目标、或拿 revision_id 作为后续 API 调用参数。同样走"User 优先 + Tenant 兜底"。 | Flag | 默认值 | 说明 | | --- | --- | --- | | `` | 必填 | 文档 ID 或 URL（`https://xxx.feishu.cn/docx/`） | | `-o, --output` | text | 输出格式，可选 `json` | | `--user-access-token` | 空 | 手动覆盖 User Token；不填则自动从 `~/.feishu-cli/token.json` 读取 | ```bash # 文本摘要 feishu-cli doc get ABC123def456 # JSON 输出（脚本里拿 revision_id / title） feishu-cli doc get ABC123def456 -o json # 从 URL 直接读 feishu-cli doc get https://xxx.feishu.cn/docx/ABC123def456 ``` ## 列出文档所有块（doc blocks） `doc export` 拿不到结构化块树时（例如要分析每个块的类型、定位特定块、查 raw API 响应），用 `doc blocks`。默认列出第一页（500 块），加 `--all` 自动分页拉完。 | Flag | 默认值 | 说明 | | --- | --- | --- | | `` | 必填 | 文档 ID（不接 URL，请先 `doc get` 拿 ID） | | `--all` | false | 自动分页获取所有块（覆盖 `--page-size` / `--page-token`） | | `--page-size` | 500 | 单页块数量 | | `--page-token` | 空 | 续页 token | | `--document-revision-id` | -1 | 文档版本（-1 = 最新） | | `--raw` | false | 输出飞书 API 原始 JSON（含未解析字段） | | `--user-id-type` | open_id | 用户 ID 类型（open_id/union_id/user_id） | | `-o, --output` | text | 输出格式，可选 `json`（CLI 归一化结构） | | `--user-access-token` | 空 | 手动覆盖 User Token | ```bash # 默认：第一页，文本摘要 feishu-cli doc blocks ABC123def456 # 全量分页 + 归一化 JSON feishu-cli doc blocks ABC123def456 --all -o json # 拿 API 原始响应（含未识别块类型的 raw 字段） feishu-cli doc blocks ABC123def456 --all --raw > /tmp/blocks_raw.json ``` ## 知识库读类（wiki get / nodes / spaces）知识库的"目录结构遍历三件套"，配合 `wiki export` 完成"找到节点 → 读内容"的链路。三个命令都走"User 优先 + Tenant 兜底"。 ### wiki get — 查节点元信息 | Flag | 默认值 | 说明 | | --- | --- | --- | | `` | 必填 | 节点 Token 或 wiki URL | | `-o, --output` | text | 输出格式，可选 `json` | | `--user-access-token` | 空 | 手动覆盖 User Token | 返回字段：`space_id` / `node_token` / `obj_token`（用于文档 API） / `obj_type`（docx/sheet/bitable/...） / `title` / `has_child`。 ### wiki nodes — 列出空间或父节点的子节点 | Flag | 默认值 | 说明 | | --- | --- | --- | | `` | 必填 | 知识空间 ID（由 `wiki get` 或 `wiki spaces` 得到） | | `--parent` | 空 | 父节点 Token；不填 = 列空间根节点 | | `--page-size` | 50 | 单页节点数量 | | `-o, --output` | text | 输出格式，可选 `json` | | `--user-access-token` | 空 | 手动覆盖 User Token | ### wiki spaces — 列出当前身份可见的所有知识空间 | Flag | 默认值 | 说明 | | --- | --- | --- | | `--page-size` | 50 | 单页空间数量 | | `-o, --output` | text | 输出格式，可选 `json` | | `--user-access-token` | 空 | 手动覆盖 User Token | ```bash # 1. 列空间 feishu-cli wiki spaces # 2. 看某节点信息，记下 space_id feishu-cli wiki get https://xxx.feishu.cn/wiki/Ad8Iw0oz3iSp4kkIi7QctVhin3e # 3. 列该节点下子文档 feishu-cli wiki nodes 7012345678901234567 --parent Ad8Iw0oz3iSp4kkIi7QctVhin3e # 4. 找到目标后用 wiki export 读内容 feishu-cli wiki export -o /tmp/child.md ``` ## 电子表格读类（sheet read / list-sheets） `sheet export --format markdown` 适合"整表导出阅读"；要按精确范围读单元格、或先列出工作表元信息，用下面两个命令。 ### sheet list-sheets — 列出电子表格的所有工作表 | Flag | 默认值 | 说明 | | --- | --- | --- | | `` | 必填 | 电子表格 Token 或 URL | | `-o, --output` | text | 输出格式，可选 `json` | | `--user-access-token` | 空 | 手动覆盖 User Token | 返回 `sheet_id` / `title` / 索引 / 隐藏状态，配合 `sheet read` 的 `SheetID!A1:C10` 范围语法用。 ### sheet read — 读指定范围单元格 | Flag | 默认值 | 说明 | | --- | --- | --- | | `` | 必填 | 电子表格 Token 或 URL | | `` | 必填 | 范围，例如 `SheetID!A1:C10`、`A1:B2`（配合 `--sheet-id`）、`Sheet1!A:C` 整列 | | `--sheet-id` | 空 | 当 range 不带 SheetID 前缀时必填 | | `--value-render` | 空 | 单元格值渲染：`ToString` / `FormattedValue` / `Formula` / `UnformattedValue` | | `--datetime-render` | 空 | 日期渲染：`FormattedString`（不填返回数字时间戳） | | `-o, --output` | text | 输出格式，可选 `json` | | `--user-access-token` | 空 | 手动覆盖 User Token | ```bash # 列出所有工作表 feishu-cli sheet list-sheets shtcnxxxxxx # 读单个范围（推荐先 list-sheets 拿 sheet_id） feishu-cli sheet read shtcnxxxxxx "0b12ab!A1:C10" # 用工作表 ID 简化范围 feishu-cli sheet read shtcnxxxxxx "A1:C10" --sheet-id 0b12ab -o json # 拿公式而非求值结果 feishu-cli sheet read shtcnxxxxxx "Sheet1!A1:B20" --value-render Formula ``` ## 执行流程 1. **解析参数** - 判断 URL 类型： - `/docx/` → 普通文档，使用 `doc export` - `/wiki/` → 知识库文档，使用 `wiki export` - 如果是 Token，根据格式判断类型 2. **导出为 Markdown（含图片下载）** **普通文档**: ```bash feishu-cli doc export --output /tmp/feishu_doc.md --download-images --assets-dir /tmp/feishu_assets ``` 文档内嵌电子表格块默认会自动展开为 Markdown 表格，便于直接阅读和分析；如果要保留 `` 标签用于 roundtrip，追加 `--expand-sheets=false`。 `doc export` 会自动解析 User Access Token（如已登录），解析优先级（与 `cmd/utils.go::resolveOptionalUserTokenWithFallback` + `internal/auth/resolve.go::ResolveUserAccessToken` 实现完全一致）： 1. `--user-access-token` 命令行参数（若该 token 等于 token.json 中已过期的 access_token，且 refresh_token 仍有效，自动刷新） 2. `FEISHU_USER_ACCESS_TOKEN` 环境变量（同样支持本机身份延伸的自动刷新） 3. `~/.feishu-cli/token.json`（通过 `auth login` 保存；access_token 过期则用 refresh_token 自动续期并写回） 4. `config.yaml` 中的 `user_access_token`（静态配置，不会自动刷新） 5. **App Token 兜底**（资源 API 也会接受，以租户身份访问；遇到 1770032/forbidden 等错误时说明该文档对 App 不可见，必须走前 4 步拿到 User Token）找到 User Token 时使用用户身份访问，未找到或解析失败时回退为 App Access Token（租户身份）。若遇到 `code=1770032 forBidden`（App 无权限且未登录）或 `code=99991679 Unauthorized`（User Token 缺少 scope），需先在飞书开放平台为应用开通 `docx:document:readonly`，然后完成 User Token 授权： ```bash # 第一步：在飞书开放平台 → 你的应用 → 权限管理 → 搜索 docx:document:readonly → 开通 # （或复制 README 的完整权限 JSON 一次性导入） feishu-cli auth login ``` **知识库文档**: ```bash feishu-cli wiki export --output /tmp/feishu_wiki.md --download-images --assets-dir /tmp/feishu_assets ``` **普通电子表格**: ```bash feishu-cli sheet export --format markdown --output /tmp/feishu_sheet.md ``` 不指定 `--sheet-id` 时会读取所有可见工作表；只看单个工作表时加 `--sheet-id `。 **重要**：务必使用 `--download-images` 参数下载文档中的图片到本地，否则只能看到 `feishu://media/` 引用，无法理解图片内容。 **可选参数**： - `--user-access-token`：手动指定 User Access Token（不填则自动从 `~/.feishu-cli/token.json` 读取） - `--front-matter`：在 Markdown 顶部添加 YAML front matter（含标题和文档 ID） - `--highlight`：保留文本颜色和背景色（输出为 HTML `` 标签） - `--expand-mentions`：展开 @用户为友好格式（默认开启，需要 contact:user.base:readonly 权限） - `--expand-sheets`：展开文档内嵌电子表格为 Markdown 表格（默认开启；设为 `false` 时保留 `` 标签） 3. **读取文本内容** - 使用 Read 工具读取导出的 Markdown 文件 - 分析文档结构和文本内容 4. **读取并理解图片内容** - 检查 `--assets-dir` 指定的目录是否有下载的图片 - **使用 Read 工具逐个读取图片文件**（Claude 支持多模态，可直接理解图片内容） - 将图片内容整合到文档分析中 ```bash # 列出下载的图片 ls /tmp/feishu_assets/ # 使用 Read 工具查看图片 # Read /tmp/feishu_assets/image_1.png # Read /tmp/feishu_assets/image_2.png ``` 5. **报告结果** - 提供文档摘要（包含图片内容描述） - 保留 Markdown 文件和图片供用户进一步操作 ## 输出格式向用户报告： - 文档标题 - 文档结构概要（标题层级） - 内容摘要（关键信息） - 图片内容描述（如有图片） - Markdown 文件路径（供后续使用） - 图片文件路径（如有下载） ## 支持的 URL 格式 | URL 格式 | 类型 | 命令 | | ----------------------------------------- | -------- | ------------- | | `https://xxx.feishu.cn/docx/` | 普通文档 | `doc export` | | `https://xxx.feishu.cn/sheets/` | 普通电子表格 | `sheet export --format markdown` | | `https://xxx.feishu.cn/wiki/` | 知识库（docx/sheet） | `wiki export` | | `https://xxx.larkoffice.com/docx/` | 普通文档 | `doc export` | | `https://xxx.larkoffice.com/sheets/` | 普通电子表格 | `sheet export --format markdown` | | `https://xxx.larkoffice.com/wiki/` | 知识库（docx/sheet） | `wiki export` | ## 示例 ```bash # 读取普通文档 feishu-cli doc export --output /tmp/feishu_doc.md --download-images --assets-dir /tmp/feishu_assets feishu-cli doc export https://xxx.feishu.cn/docx/ --output /tmp/feishu_doc.md # 读取知识库文档 feishu-cli wiki export --output /tmp/feishu_wiki.md --download-images --assets-dir /tmp/feishu_assets feishu-cli wiki export https://xxx.feishu.cn/wiki/ --output /tmp/feishu_wiki.md # 读取普通电子表格为 Markdown feishu-cli sheet export --format markdown -o /tmp/feishu_sheet.md ``` ## 导出格式说明导出的 Markdown 支持以下飞书特有块类型的转换： | 飞书块类型 | Markdown 表现 | | ------------------ | ------------------------------------------------------ | | Callout 高亮块 | `> [!NOTE]`、`> [!WARNING]` 等 6 种 GitHub-style alert | | 块级/行内公式 | `$formula$`（LaTeX 格式） | | 画板 (Board) | `[画板/Whiteboard](feishu://board/...)` 链接 | | 电子表格块 (Sheet) | 默认展开为 Markdown 表格；关闭 `--expand-sheets` 时输出 `` | | ISV 块 (Mermaid) | 画板链接 | | QuoteContainer | `>` 引用语法（支持嵌套） | | AddOns/SyncedBlock | 透明展开子块内容 | | Iframe | `