---
name: history-auditor
description: 历史对话审计 Skill。审查长期协作历史，提取用户稳定偏好、重复任务类型、未解决的循环、以及可升级为 Skill/Rule 的工作规律。触发词：「审查历史对话」「回顾过去的工作」「分析我们做过什么」「从历史中提取规律」「哪些任务重复出现」「有什么可以沉淀成Skill的」。
---

# 历史对话审计（history-auditor）

> 把长期协作历史从「记忆碎片」转变成「可复用的协作规范」。
> 基于 closure-orchestration-package 的 history-auditor 本地化。

---

## 激活后立即执行

```
Step 1  确认审计范围
        询问（如未说明）：
        「审计范围是：
          ① 本工作区全部历史对话（从头到现在）
          ② 最近 N 天的对话
          ③ 特定项目相关的对话」

Step 2  扫描历史对话记录
        用 explore 子智能体扫描：
        /Users/boyuan/.cursor\projects\t-TashanAgent4S-2026-0310-huaxiang\agent-transcripts\
        → 提取每个对话的第一条用户消息（任务摘要）
        → 按时间排序

Step 3  分类分析（四个维度）
        
        【维度1：重复任务类型】
        → 哪些任务出现了 3 次以上？
        → 这类任务有没有对应的 Skill？
        → 没有 Skill 的重复任务 = PENDING-SKILLS 候选
        
        【维度2：稳定偏好模式】
        → 用户在哪类任务上有固定的「做法偏好」？
        → 哪些偏好应该变成 Rule（alwaysApply）？
        → 区分：稳定偏好 vs 一次性特殊需求
        
        【维度3：未关闭的循环】
        → 哪些问题被反复提到但没有被彻底解决？
        → 哪些任务开始了但没有完成闭环？
        
        【维度4：已发现的工作规律】
        → AI 和用户共同摸索出了哪些「对的做法」？
        → 这些规律是否已经被 Skill/Rule 捕捉？

        【维度5：结构性执行力缺口——反思质量的核心维度】
        ⚠️ AI 在反思时容易只看到表层（「我疏忽了」），而看不到根本原因（规范/机制本身设计有问题）。
        本维度专门诊断这类结构性问题。

        扫描问题：
        → 哪些行为 AI 被反复提醒，但依然重复出错（≥2次同类失败）？
          → 这类行为靠「提醒」无法可靠执行，需要分析：是执行层疏忽，还是规范机制本身有设计缺陷？

        → 哪些重要规范/文档，AI 只有在特定 Skill 被触发时才知道？
          → 如果这些规范需要普遍遵守，就应该在 alwaysApply Rule 或 D0 中存在，而不是只在一个 Skill 里

        → 哪些规范写的是「建议/应该」，但实际上需要强制执行？
          → 「建议」在有压力时会被跳过，应改为「禁止/必须」+硬性门槛

        → 哪些知识/文档，AI 需要靠记忆才能想起来读？
          → 凡是「靠 AI 记忆」才能生效的，就存在结构性可靠性风险；应通过 D0 / Rule / Step 1 强制注入

        诊断结论分类（对每个发现的缺口）：
        · 【连接缺口】：规范存在但没有通过 D0/Rule 进入上下文
        · 【类型错误】：普遍约束放在了 Skill 里（只有被触发才生效）
        · 【执行力度】：规范是建议而非禁止，缺乏强制约束
        · 【覆盖错误】：规范覆盖的场景范围有误（太窄/太宽）
        · 【表述歧义】：规范可以被多种理解，导致执行不一致

Step 4  生成审计报告
        写入：_内部总控/历史审计报告_YYYYMMDD.md

Step 5  生成改进建议
        对每个发现的规律，输出以下六类推荐动作之一（按优先级从高到低判断）：

        1. **更新/新建 Rule**：若规律是「所有任务都必须遵守的普遍约束」（轻量，违反有后果）
           → 推荐动作：新建 Rule / 更新已有 Rule（通过 skill-rule-修改规范）
        2. **更新/新建 Agent**：若规律是「某类任务需要独立视角或并行执行」
           → 推荐动作：新建 Agent / 更新已有 Agent（通过 skill-designer Level 2）
        3. **更新规范/参考文档**：若规律是某份规范手册/技术架构文档内容有误或遗漏
           → 推荐动作：更新规范文档（通过 project-doc-versioning-guard）
        4. **新建 Skill**：若规律是「重复出现的任务类型，目前无对应 Skill」
           → 推荐动作：新建 Skill（加入 PENDING-SKILLS，通过 skill-designer）
        5. **更新现有 Skill**：若规律是「已有 Skill 的步骤/触发词/行为有问题」
           → 推荐动作：更新已有 Skill（通过 skill-capture-closure 或 skill-rule-修改规范）
        6. **记录为认知结构碎片**：若规律是「用户的认知洞见/偏好，不涉及 AI 行为规范」
           → 推荐动作：触发 cognitive-capture-fragment 写入 L2 碎片

        每条建议附带：
        - 优先级：P0/P1/P2
        - 建议触发词（方便用户立即执行）
        - 若适用：建议加入 PENDING-SKILLS.md 的条目格式

Step 5.5  若发现重复踩坑（同类错误在历史中出现≥2次）：
        → 立即提示用户：「🔁 检测到重复踩坑：[踩坑描述]。建议现在沉淀此经验——说「这个经验值得记」即可触发 skill-capture-closure」
        → 不等用户问，主动给出触发词，方便立即执行
```

---

## 输出格式

```markdown
# 历史对话审计报告

**审计日期**：YYYY-MM-DD
**覆盖范围**：[时间范围/项目范围]
**对话总数**：N

## 重复任务类型（出现 ≥3 次）

| 任务类型 | 出现次数 | 现有 Skill | 建议 |
|---|---|---|---|

## 稳定偏好模式

| 偏好描述 | 证据（对话引用）| 建议落地方式（Rule/Skill/文档/认知碎片）|
|---|---|---|

## 未关闭的循环

| 问题描述 | 最近出现时间 | 建议处理方式 |
|---|---|---|

## 已发现但未沉淀的工作规律

| 规律描述 | 产物类型 | 建议组件名称/文档路径 | 优先级 | 建议触发词 |
|---|---|---|---|---|
| [规律描述] | Rule/Agent/规范文档/Skill/认知碎片 | [名称或路径] | P0/P1/P2 | [用户可以说的话] |

## 需要修订的已有组件/文档

| 组件/文档 | 问题描述 | 建议动作 | 优先级 |
|---|---|---|---|
| [名称] | [Rule歧义/Agent行为错误/文档内容有误] | 更新 Rule/Agent/规范文档 | P0/P1/P2 |

## 结构性执行力缺口（维度5——反思质量的核心）

> 以下问题不是「AI 执行失败」，而是「规范/机制设计本身有缺陷」

| 缺口描述 | 缺口类型 | 当前状态 | 建议修复方式 | 优先级 |
|---|---|---|---|---|
| [某行为 AI 反复出错，历史中出现N次] | 连接缺口/类型错误/执行力度/覆盖错误/表述歧义 | [靠Skill注意事项/靠AI记忆/建议语气] | [补D0/升级为Rule/修改为禁止/缩小覆盖范围] | P0/P1/P2 |
```

---

## 注意事项

- **任务内容 vs 稳定偏好**：不要把一次性任务的具体内容当成偏好。只有重复出现、跨项目适用的，才是偏好
- **审计完后触发**：结论应路由到 PENDING-SKILLS（新 Skill 候选）或 cognitive-capture-fragment（认知碎片）

---

## 变更记录

### v1.1 — 2026-03-22 — 新增 Step 5.5 重复踩坑显式触发（GAP-CO010-1 修复）

**根因**：scenario-sandbox-builder Phase 2 验证（CO-010沙盘）发现：history-auditor Step 5 只在注意事项中提到「结论应路由到 skill-capture-closure」，缺少显式的 Step 调用——审计完成后，经验沉淀依赖用户手动说触发词，容易遗漏。

**修改内容**：
- 新增：Step 5.5 「若发现重复踩坑（同类错误≥2次）→ 立即提示用户并给出 skill-capture-closure 触发词，不等用户问」
- 备份路径：`history/SKILL_v1.0_20260322_before_co010.md`

**验证方法**：history-auditor 发现重复踩坑时，应主动输出「建议说「这个经验值得记」触发 skill-capture-closure」
**验证状态**：🔵 待验证

---

### v1.0 — 2026-03-19 — 初始创建

**根因**：今日已手动执行过一次历史对话审计（扫描92条对话），发现这是一个高价值的重复任务，需要正式化为 Skill。基于外部包的 history-auditor 本地化，加入认知结构碎片路由。

**验证状态**：🔵 待验证

---

### v1.2 — 2026-03-23 — Step 5 推荐动作全类型展开 + 输出格式补全（产物类型覆盖修复）

**根因**：Step 5 的推荐动作列表只有「新建Skill/新建Rule/更新Skill/认知碎片」，缺少「更新已有Rule」「新建/更新Agent」「更新规范文档」三类；输出格式表格也缺乏「需要修订的已有组件」维度。

**修改内容**：
- 修改：Step 5 → 从 4 种推荐动作扩展为 6 类（Rule/Agent/规范文档/新建Skill/更新Skill/认知碎片），每类含判断标准、建议触发词
- 修改：输出格式 → 「已发现但未沉淀的工作规律」表格增加「产物类型」「建议触发词」列
- 新增：「需要修订的已有组件/文档」表格（覆盖 Rule 歧义/Agent 行为错误/文档内容有误等）

**备份路径**：`history/SKILL_v1.1_20260323_before_full-actions.md`

**验证状态**：🔵 待验证

---

### v1.3 — 2026-03-23 — 新增维度5（结构性执行力缺口）+ 对应输出表格（元反思层修复）

**根因**：history-auditor 的四个分析维度都在问「发生了什么/有什么规律」，但没有一个维度在问「AI 反复失败是因为规范/机制设计有缺陷」——这是最有价值的改进来源，但被系统性忽略了。

**修改内容**：
- 新增：维度5「结构性执行力缺口」——专门诊断靠提醒无法解决的系统性问题（连接缺口/类型错误/执行力度/覆盖错误/表述歧义）
- 新增：输出格式「结构性执行力缺口」表格

**备份路径**：`history/SKILL_v1.2_20260323_before_dim5.md`

**验证状态**：🔵 待验证