--- name: get-review-theme description: 当用户明确要求"从文件/图片/网页/描述中提取综述主题"或"生成主题+关键词+核心问题结构化输出"时使用。支持文件(PDF/Word/Markdown/Tex)、文件夹、图片、自然语言描述、网页 URL 等多种输入源,自动识别输入类型并提取内容,生成可直接用于 systematic-literature-review 及其他文献综述技能的结构化输出。 metadata: author: Bensz Conan short-description: 多源输入的结构化综述主题提取工具 keywords: - get-review-theme - 主题提取 - 综述主题 - review topic - 关键词提取 - 核心问题识别 - 文献调研准备 - systematic literature review - 输入分析 - PDF 分析 - 图片理解 - 网页解析 - 内容理解 - 学术主题识别 --- # Get Review Theme ## 与 bensz-collect-bugs 的协作约定 - 当用户环境中出现因本 skill 设计缺陷导致的 bug 时,优先使用 `bensz-collect-bugs` 按规范记录到 `~/.bensz-skills/bugs/`,严禁直接修改用户本地 Claude Code / Codex 中已安装的 skill 源码。 - 若 AI 仍可通过 workaround 继续完成用户任务,应先记录 bug,再继续完成当前任务。 - 当用户明确要求“report bensz skills bugs”等公开上报动作时,调用本地 `gh` 与 `bensz-collect-bugs`,仅上传新增 bug 到 `huangwb8/bensz-bugs`;不要 pull / clone 整个 bug 仓库。 ## 定位 - 从文件、图片、网页、文件夹或自然语言描述中提取结构化综述主题。 - 输出直接服务 `systematic-literature-review` 或其他文献综述工作流。 - 最高原则:主题要可操作、关键词要能检索、核心问题要具体。 ## 输入 必需: - `{输入源}`:文件路径、URL、文件夹路径、图片路径,或直接文本描述 可选: - `{输出格式}`:`text` / `yaml` / `json`,默认 `text` ## 输出 始终包含三项: - `主题` - `关键词` - `核心问题` 格式由用户选择: - `text` - `yaml` - `json` ## 工作流 ### 1. 识别输入类型 - 自然语言描述 - 图片 - URL - 文本文件 - PDF - Word - 文件夹 ### 2. 提取内容 - 自然语言:直接使用 - 图片:依赖 LLM 原生视觉能力 - URL:优先网页读取工具,失败则请用户提供正文 - 文本 / PDF / Word:直接读取 - 文件夹:递归扫描并合并 `.md/.txt/.pdf` 等核心材料 原则: - 优先用宿主原生能力和现有标准工具 - 工具不可用时优雅降级,不额外引入脚本依赖 ### 3. 语义提取 围绕以下任务输出: - 用一句话概括主题 - 提取 5-10 个英文标准术语 - 提取 2-5 个具体研究问题或挑战 ### 4. 格式化 - `text`:适合直接复制给下游 skill - `yaml` / `json`:适合结构化衔接 ## 质量要求 - 主题要包含研究对象与核心问题或方法 - 关键词优先用标准检索术语 - 核心问题必须具体,避免“意义重大/挑战很多”这种空话 ## 错误处理 - 文件不存在:提示用户改路径或直接粘贴内容 - 格式不支持:提示转换 - 内容提取失败:让用户手动提供文本 - URL 解析失败:让用户复制网页正文或提供 PDF - 图片语义不清:请用户补一句描述 ## 与下游技能的关系 - `topic` 可直接喂给 `systematic-literature-review` - `keywords` 可补充检索策略 - `core_questions` 可作为综述边界和纳排参考