---
name: cognitive-calibrate
description: 置信度校准（元认知监控）。追踪L1文档和L2碎片中「AI生成/推断」的内容是否事后得到了验证，定期向用户提问「这段内容当时是AI推断，现在有没有实际证据？」。触发词：「验证历史内容」「校准知识置信度」「哪些内容还没验证」「cognitive-calibrate」。也被 cognitive-consistency-check 内部调用（月度维护）。
---

# cognitive-calibrate（置信度校准 / 元认知置信度监控）

> **对应认知活动**：元认知的置信度校准——追踪🟡AI生成内容是否事后得到验证，防止「自我确认偏误」导致未验证的推断长期被当作事实
>
> **认知五维坐标（COG-TAX）**：
> - 意识程度：显性（需要用户参与确认）
> - 脑网络：CEN（目标导向的检索与判断）+ SN（不确定性检测）
> - 记忆系统：语义记忆的准确性评估
> - 执行功能：监控（Monitoring），是元认知的核心成分
> - 双系统：系统2（需要主动评估，不能自动化）
>
> **理论依据**：Flavell (1979) 元认知监控；Dunning & Kruger (1999) 元认知准确性；Nelson & Narens (1990) 置信度监控框架
>
> **调用时机**：
> 1. 被 cognitive-consistency-check 内部调用（月度维护，Step 8）
> 2. 用户主动触发（「验证历史内容」「校准知识置信度」）
>
> **Headless调用说明**（被 cognitive-consistency-check Step 8 调用时）：
> - 调用方传入默认范围参数：scope="ALL_90_DAYS"（跳过Step 0的交互选择）
> - 跳过 Step 0：不询问用户，直接使用 scope="ALL_90_DAYS" 执行 Step 1
> - 若筛选结果 > 10条：Headless模式下只处理前10条（避免过长执行）
> - 所有 Step 4 的结果写入 todo.md，等待下次 daily-briefing 展示给用户
> - 不向对话输出 Step 4 的摘要（Headless模式静默执行）

---

## 知识导航表

| 层级 | 文档 | 用途 |
|------|------|------|
| D0 碎片索引 | `cognitive/L2_fragments/fragment_index.md` | 找到所有「归因=🟡AI生成/推断，验证状态=未验证」的条目 |
| D0 L1 文档 | `cognitive/L1_knowledge/[各维度文档]`（含🟡标注的段落）| 找到需要验证的具体内容 |

---

## 激活后立即执行

```
Step 0  确认检查范围
        Ask: 本次校准的范围？
        选项 A：90天以上未验证的🟡内容（全量，可能较多）
        选项 B：指定某个L1文档（精准，快速）
        选项 C：从上次校准以来的所有🟡内容

Step 1  读取待验证条目
        Read: cognitive/L2_fragments/fragment_index.md
        → 筛选：归因类型=🟡AI生成/推断 AND 验证状态=🔲未验证 AND capture_time < 今天-[范围天数]
        → 提取：碎片ID、标题、capture_time

        Read: cognitive/L1_knowledge/[目标文档]
        → 扫描🟡归因标注的段落
        → 提取：段落位置、内容摘要（前150字）、标注时间

        → 若筛选结果为0条 → 告知用户「选定范围内无需校准的内容（🟡内容已全部处理，或该范围内无🟡归因内容）」
           然后退出，不继续执行 Step 2 以后的步骤

Step 2  逐条向用户展示并询问

        对每个待验证条目，展示：
        ---
        📋 [内容编号/N]
        **来源**：[L1文档名 §章节] / [L2碎片ID「标题」]
        **当时的归因**：🟡 AI生成/推断（[capture_date]，距今[N]天）
        **内容摘要**：[前150字]

        **问题**：这段内容当时是AI的推断。现在：
        A. ✅ 已有实际证据支持（标记为「已验证」）
        B. ❌ 事后发现是错的（标记为「已否定」，需要修订L1/L2）
        C. ⏸️ 还不确定，继续观察
        D. ⏭️ 跳过这条（稍后处理）
        ---

Step 3  根据用户回答更新验证状态

        A（已验证）：
        → 更新 fragment_index.md：验证状态=✅已验证，verified_date=今天
        → 更新 L1 文档：将🟡标注改为✅（StrReplace）

        B（已否定）：
        → 更新 fragment_index.md：验证状态=❌已否定，verified_date=今天
        → 在 cognitive/L3_logs/todo.md 追加：
          □ [校准-YYYYMMDD] 碎片[ID]/[L1段落]已被否定，需要修订对应内容
          建议：运行 cognitive-update-knowledge 或 cognitive-detect-contradiction
        → 不自动修改 L1（修订需要用户确认）

        C（继续观察）：
        → 更新 fragment_index.md：验证状态=⏸️观察中，last_check=今天
        → 不做其他操作

        D（跳过）：
        → 不更新验证状态
        → 记录「已跳过」供下次校准时再展示

Step 4  生成校准摘要

        输出：
        ---
        ## 置信度校准摘要（[今日日期]）
        处理条目：N条
        - ✅ 已验证：X条
        - ❌ 已否定（需修订）：Y条 → 已加入待完成清单
        - ⏸️ 继续观察：Z条
        - ⏭️ 跳过：W条（下次校准时再显示）
        ---

Step 5  追加系统日志
        Write: cognitive/L3_logs/system_log.md（追加）
        格式：[LOG-YYYYMMDD-NN] cognitive-calibrate | 校准完成：验证X条，否定Y条，观察Z条 | fragment_index.md
```

---

## 归因标注说明

| 归因类型 | 含义 | 需要校准？ |
|----------|------|----------|
| 🟢 user_original | 用户直接说出的内容 | 否 |
| 🟡 ai_inference | AI推断/合成，未经用户确认 | **是（本Skill的核心对象）** |
| 🔵 ai_synthesis | AI整合多个来源的综合 | 是（可选） |
| ✅ verified | 已经过校准确认 | 否 |
| ❌ rejected | 已被否定 | 否（但需要修订文档）|

---

## D5：任务完成后的 Loop 反馈

**本次执行产出**：
- K-object 更新：碎片索引验证状态更新 + L1 文档🟡→✅标注修改
- S-object 追加：系统日志 + 待完成清单（否定类条目）

**Loop 路由**：
- **通路B（Loop 3 → Loop 2）**：发现被否定内容 → 追加到 todo.md → 等待 cognitive-update-knowledge 修订
- **系统完整性**：随时间推移，🟡内容比例降低，🟢/✅内容比例上升，知识准确性持续提升

**信号类型（A-G框架）**：
- 发现已否定内容（B类）≥ 3条 → **G信号**（结构性根因：🟡归因机制被过度使用，AI推断质量需要系统性改进）
- 所有内容已验证通过（A类）→ 通路A内部完成，无额外信号（知识准确性良好）
- 发现大量「⏸️无法验证」 → **A信号**（Skill改进：calibrate步骤可补充外部验证引导机制）

---

## 变更记录

### v0.1 — 2026-03-23 — 从全量认知Skill规范.md Skill 13 复现

**来源**：会话 a55a4e9e（认知体系完善规划），全量规范 §Skill 13
**路径映射**：原 _内部总控/ 路径已替换为 cognitive/ 通用路径
**状态**：🟡 待审核（Gate A/B/C 尚未通过）
**存放位置**：pending-skills/（非正式部署区）