--- name: harness-audit description: Harness 能力面审计(7 维度评分 + 改进建议)。对角色覆盖、技能完整性、Hook 有效性、规则执行、命令覆盖、文档质量、集成深度进行全面评估,输出 Overall Score、Dimension Scores 和 Top Actions。适用于平台健康检查、季度能力审查、新增能力后的回归验证。关键词:harness-audit、平台审计、技能完整性、Agent 覆盖、命令覆盖、文档质量。 --- # Harness 能力面审计 对当前平台配置进行 **7 维度评分**,定位能力短板并给出优先改进建议。 --- ## 触发方式 ``` /harness-audit ``` 或由 `harness-optimizer` specialist 直接调用。 --- ## 7 个评估维度 ### 1. Agent Coverage(代理覆盖) 检查所有角色是否有对应的 `agents/roles/*.md` 生成文件,specialist agents 是否与 `commands/` 命令一一对应。 **评分标准**: - 90–100:所有角色 + 全部 specialist 覆盖完整 - 70–89:≥ 2 个角色或 specialist 缺失 - < 70:核心角色缺失 agent 文件 ### 2. Skill Completeness(技能完整性) 检查 `skills/`、`skills/`、`skills/` 中所有技能是否有有效 `SKILL.md`,role.yaml 中引用的技能是否实际存在。 **评分标准**: - 90–100:无悬空引用,所有 SKILL.md 齐备 - 70–89:1–3 处悬空引用 - < 70:多处悬空引用或 SKILL.md 缺失 ### 3. Hook Effectiveness(Hook 有效性) 检查 `hooks/hooks.json` 配置是否启用关键 hook,`session_start.py`/`session_end.py` 是否能实际运行。 **评分标准**: - 90–100:hooks 配置完整,smoke 验证通过 - 70–89:hooks 存在但未启用 - < 70:hooks 缺失或运行报错 ### 4. Rule Enforcement(规则执行) 检查 `rules/` 中所有规则文件是否被 CLAUDE.md/AGENTS.md 或角色的 `governance_rules` 字段引用。 **评分标准**: - 90–100:无孤立规则,所有规则有引用入口 - 70–89:≤ 3 个孤立规则 - < 70:> 3 个孤立规则或核心规则未引用 ### 5. Command Coverage(命令覆盖) 检查 `commands/` 中每个命令是否在 CLAUDE.md/AGENTS.md 的命令面中列出,specialist 与命令是否匹配。 **评分标准**: - 90–100:命令与 AGENTS.md 门面一致 - 70–89:1–2 个命令缺少文档入口 - < 70:> 2 个命令游离于门面之外 ### 6. Documentation Quality(文档质量) 检查 `docs/runbooks/`、`docs/memory/`(若存在)中关键手册是否存在,AGENTS.md 中链接的文件是否实际可访问。 **评分标准**: - 90–100:所有 AGENTS.md 链接文件存在,docs/memory/ 已初始化 - 70–89:≤ 5 个链接失效 - < 70:> 5 个链接失效或 docs/memory/ 不存在 ### 7. Integration Depth(集成深度) 评估 role.yaml 中 `recommended_ecc_skills` / `recommended_domain_skills` 覆盖情况,以及各角色能力与其职责的匹配度。 **评分标准**: - 90–100:所有角色至少有 3 个 ecc + 2 个 domain skills(适用角色) - 70–89:部分角色 skills 配置稀疏 - < 70:多个角色零 skills 配置 --- ## 标准输出格式 ```markdown ## Harness Audit Report — {date} ### Overall Score: {score}/100 | 维度 | 得分 | 状态 | 主要问题 | |------|------|------|---------| | Agent Coverage | XX | ✅/⚠️/❌ | ... | | Skill Completeness | XX | ✅/⚠️/❌ | ... | | Hook Effectiveness | XX | ✅/⚠️/❌ | ... | | Rule Enforcement | XX | ✅/⚠️/❌ | ... | | Command Coverage | XX | ✅/⚠️/❌ | ... | | Documentation Quality | XX | ✅/⚠️/❌ | ... | | Integration Depth | XX | ✅/⚠️/❌ | ... | ### Top Actions(优先级排序) 1. **[优先级:高]** {具体行动} — 影响维度:{维度名} 2. ... ### Recommendations - {建议1} - {建议2} ``` --- ## 执行步骤 1. `ls agents/roles/ | wc -l` 与 `roles/` 数量对比 → Agent Coverage 2. `node scripts/validate-library.js` → Skill Completeness(利用已有验证工具) 3. 检查 `hooks/hooks.json` enabled 字段 + `python3 scripts/hooks/session_end.py --dry-run`(若支持)→ Hook Effectiveness 4. `grep -r "governance_rules" roles/` 与 `ls rules/` 对比 → Rule Enforcement 5. 比对 `AGENTS.md` 命令表与 `ls commands/` → Command Coverage 6. 遍历 AGENTS.md 中所有 Markdown 链接,验证目标文件存在 → Documentation Quality 7. 遍历所有 role.yaml 的 `recommended_ecc_skills` + `recommended_domain_skills` 字段 → Integration Depth 8. 汇总得分,输出报告 --- ## 配合规则 - 执行后按 `artifact-standards.md` 写入 `docs/artifacts/{slug}/harness-audit-report.md` - 发现 skill 悬空引用时,联动触发修复建议(可对接 `/build-fix`)