--- name: history-auditor description: 历史对话审计 Skill。审查长期协作历史,提取用户稳定偏好、重复任务类型、未解决的循环、以及可升级为 Skill/Rule 的工作规律。触发词:「审查历史对话」「回顾过去的工作」「分析我们做过什么」「从历史中提取规律」「哪些任务重复出现」「有什么可以沉淀成Skill的」。 --- # 历史对话审计(history-auditor) > 把长期协作历史从「记忆碎片」转变成「可复用的协作规范」。 > 基于 closure-orchestration-package 的 history-auditor 本地化。 --- ## 激活后立即执行 ``` Step 1 确认审计范围 询问(如未说明): 「审计范围是: ① 本工作区全部历史对话(从头到现在) ② 最近 N 天的对话 ③ 特定项目相关的对话」 Step 2 扫描历史对话记录 用 explore 子智能体扫描: /Users/boyuan/.cursor\projects\t-TashanAgent4S-2026-0310-huaxiang\agent-transcripts\ → 提取每个对话的第一条用户消息(任务摘要) → 按时间排序 Step 3 分类分析(四个维度) 【维度1:重复任务类型】 → 哪些任务出现了 3 次以上? → 这类任务有没有对应的 Skill? → 没有 Skill 的重复任务 = PENDING-SKILLS 候选 【维度2:稳定偏好模式】 → 用户在哪类任务上有固定的「做法偏好」? → 哪些偏好应该变成 Rule(alwaysApply)? → 区分:稳定偏好 vs 一次性特殊需求 【维度3:未关闭的循环】 → 哪些问题被反复提到但没有被彻底解决? → 哪些任务开始了但没有完成闭环? 【维度4:已发现的工作规律】 → AI 和用户共同摸索出了哪些「对的做法」? → 这些规律是否已经被 Skill/Rule 捕捉? 【维度5:结构性执行力缺口——反思质量的核心维度】 ⚠️ AI 在反思时容易只看到表层(「我疏忽了」),而看不到根本原因(规范/机制本身设计有问题)。 本维度专门诊断这类结构性问题。 扫描问题: → 哪些行为 AI 被反复提醒,但依然重复出错(≥2次同类失败)? → 这类行为靠「提醒」无法可靠执行,需要分析:是执行层疏忽,还是规范机制本身有设计缺陷? → 哪些重要规范/文档,AI 只有在特定 Skill 被触发时才知道? → 如果这些规范需要普遍遵守,就应该在 alwaysApply Rule 或 D0 中存在,而不是只在一个 Skill 里 → 哪些规范写的是「建议/应该」,但实际上需要强制执行? → 「建议」在有压力时会被跳过,应改为「禁止/必须」+硬性门槛 → 哪些知识/文档,AI 需要靠记忆才能想起来读? → 凡是「靠 AI 记忆」才能生效的,就存在结构性可靠性风险;应通过 D0 / Rule / Step 1 强制注入 诊断结论分类(对每个发现的缺口): · 【连接缺口】:规范存在但没有通过 D0/Rule 进入上下文 · 【类型错误】:普遍约束放在了 Skill 里(只有被触发才生效) · 【执行力度】:规范是建议而非禁止,缺乏强制约束 · 【覆盖错误】:规范覆盖的场景范围有误(太窄/太宽) · 【表述歧义】:规范可以被多种理解,导致执行不一致 Step 4 生成审计报告 写入:_内部总控/历史审计报告_YYYYMMDD.md Step 5 生成改进建议 对每个发现的规律,输出以下六类推荐动作之一(按优先级从高到低判断): 1. **更新/新建 Rule**:若规律是「所有任务都必须遵守的普遍约束」(轻量,违反有后果) → 推荐动作:新建 Rule / 更新已有 Rule(通过 skill-rule-修改规范) 2. **更新/新建 Agent**:若规律是「某类任务需要独立视角或并行执行」 → 推荐动作:新建 Agent / 更新已有 Agent(通过 skill-designer Level 2) 3. **更新规范/参考文档**:若规律是某份规范手册/技术架构文档内容有误或遗漏 → 推荐动作:更新规范文档(通过 project-doc-versioning-guard) 4. **新建 Skill**:若规律是「重复出现的任务类型,目前无对应 Skill」 → 推荐动作:新建 Skill(加入 PENDING-SKILLS,通过 skill-designer) 5. **更新现有 Skill**:若规律是「已有 Skill 的步骤/触发词/行为有问题」 → 推荐动作:更新已有 Skill(通过 skill-capture-closure 或 skill-rule-修改规范) 6. **记录为认知结构碎片**:若规律是「用户的认知洞见/偏好,不涉及 AI 行为规范」 → 推荐动作:触发 cognitive-capture-fragment 写入 L2 碎片 每条建议附带: - 优先级:P0/P1/P2 - 建议触发词(方便用户立即执行) - 若适用:建议加入 PENDING-SKILLS.md 的条目格式 Step 5.5 若发现重复踩坑(同类错误在历史中出现≥2次): → 立即提示用户:「🔁 检测到重复踩坑:[踩坑描述]。建议现在沉淀此经验——说「这个经验值得记」即可触发 skill-capture-closure」 → 不等用户问,主动给出触发词,方便立即执行 ``` --- ## 输出格式 ```markdown # 历史对话审计报告 **审计日期**:YYYY-MM-DD **覆盖范围**:[时间范围/项目范围] **对话总数**:N ## 重复任务类型(出现 ≥3 次) | 任务类型 | 出现次数 | 现有 Skill | 建议 | |---|---|---|---| ## 稳定偏好模式 | 偏好描述 | 证据(对话引用)| 建议落地方式(Rule/Skill/文档/认知碎片)| |---|---|---| ## 未关闭的循环 | 问题描述 | 最近出现时间 | 建议处理方式 | |---|---|---| ## 已发现但未沉淀的工作规律 | 规律描述 | 产物类型 | 建议组件名称/文档路径 | 优先级 | 建议触发词 | |---|---|---|---|---| | [规律描述] | Rule/Agent/规范文档/Skill/认知碎片 | [名称或路径] | P0/P1/P2 | [用户可以说的话] | ## 需要修订的已有组件/文档 | 组件/文档 | 问题描述 | 建议动作 | 优先级 | |---|---|---|---| | [名称] | [Rule歧义/Agent行为错误/文档内容有误] | 更新 Rule/Agent/规范文档 | P0/P1/P2 | ## 结构性执行力缺口(维度5——反思质量的核心) > 以下问题不是「AI 执行失败」,而是「规范/机制设计本身有缺陷」 | 缺口描述 | 缺口类型 | 当前状态 | 建议修复方式 | 优先级 | |---|---|---|---|---| | [某行为 AI 反复出错,历史中出现N次] | 连接缺口/类型错误/执行力度/覆盖错误/表述歧义 | [靠Skill注意事项/靠AI记忆/建议语气] | [补D0/升级为Rule/修改为禁止/缩小覆盖范围] | P0/P1/P2 | ``` --- ## 注意事项 - **任务内容 vs 稳定偏好**:不要把一次性任务的具体内容当成偏好。只有重复出现、跨项目适用的,才是偏好 - **审计完后触发**:结论应路由到 PENDING-SKILLS(新 Skill 候选)或 cognitive-capture-fragment(认知碎片) --- ## 变更记录 ### v1.1 — 2026-03-22 — 新增 Step 5.5 重复踩坑显式触发(GAP-CO010-1 修复) **根因**:scenario-sandbox-builder Phase 2 验证(CO-010沙盘)发现:history-auditor Step 5 只在注意事项中提到「结论应路由到 skill-capture-closure」,缺少显式的 Step 调用——审计完成后,经验沉淀依赖用户手动说触发词,容易遗漏。 **修改内容**: - 新增:Step 5.5 「若发现重复踩坑(同类错误≥2次)→ 立即提示用户并给出 skill-capture-closure 触发词,不等用户问」 - 备份路径:`history/SKILL_v1.0_20260322_before_co010.md` **验证方法**:history-auditor 发现重复踩坑时,应主动输出「建议说「这个经验值得记」触发 skill-capture-closure」 **验证状态**:🔵 待验证 --- ### v1.0 — 2026-03-19 — 初始创建 **根因**:今日已手动执行过一次历史对话审计(扫描92条对话),发现这是一个高价值的重复任务,需要正式化为 Skill。基于外部包的 history-auditor 本地化,加入认知结构碎片路由。 **验证状态**:🔵 待验证 --- ### v1.2 — 2026-03-23 — Step 5 推荐动作全类型展开 + 输出格式补全(产物类型覆盖修复) **根因**:Step 5 的推荐动作列表只有「新建Skill/新建Rule/更新Skill/认知碎片」,缺少「更新已有Rule」「新建/更新Agent」「更新规范文档」三类;输出格式表格也缺乏「需要修订的已有组件」维度。 **修改内容**: - 修改:Step 5 → 从 4 种推荐动作扩展为 6 类(Rule/Agent/规范文档/新建Skill/更新Skill/认知碎片),每类含判断标准、建议触发词 - 修改:输出格式 → 「已发现但未沉淀的工作规律」表格增加「产物类型」「建议触发词」列 - 新增:「需要修订的已有组件/文档」表格(覆盖 Rule 歧义/Agent 行为错误/文档内容有误等) **备份路径**:`history/SKILL_v1.1_20260323_before_full-actions.md` **验证状态**:🔵 待验证 --- ### v1.3 — 2026-03-23 — 新增维度5(结构性执行力缺口)+ 对应输出表格(元反思层修复) **根因**:history-auditor 的四个分析维度都在问「发生了什么/有什么规律」,但没有一个维度在问「AI 反复失败是因为规范/机制设计有缺陷」——这是最有价值的改进来源,但被系统性忽略了。 **修改内容**: - 新增:维度5「结构性执行力缺口」——专门诊断靠提醒无法解决的系统性问题(连接缺口/类型错误/执行力度/覆盖错误/表述歧义) - 新增:输出格式「结构性执行力缺口」表格 **备份路径**:`history/SKILL_v1.2_20260323_before_dim5.md` **验证状态**:🔵 待验证