---
title: "读完 Agent Loop 工程手册，我有 8 个还没想明白的问题"
source: "陈进 / 腾讯云开发者"
source_url: "https://mp.weixin.qq.com/s/DtQ0FfSpUxYdRR8XOvppaw"
ingested: 2026-06-16
sha256: "5293ebfb5c6870f44aad451fc2c6138ed31296fce11f4b2113bbad515644c077"
type: raw
tags: [agent, agent-loop, harness-engineering, multi-agent, memory, guardrails, stopping-condition, tencent-cloud, chen-jin, 2026, second-hand-interpretation, self-protocol]
review_value: 8
review_confidence: 8
---

# 读完 Agent Loop 工程手册，我有 8 个还没想明白的问题

**作者**：陈进 | **公众号**：腾讯云开发者 | **发布时间**：2026-06-16 08:45 | **类型**：二手解读 + 30 天单 Agent 实验数据

## 来源说明（重要）

文中提到的 Agent Loop：来源 = Peter Steinberger（OpenClaw 创始人）近期提出的"从写 Prompt 到设计 Loop"范式 + Boris Cherny（Claude Code 创始人）公开实践 + 社群整理的工程手册（Reddit / X 讨论量约 220 万）。作者读的是社群手册和公开讨论，**未接触作者原始全文，属二手解读**。如有出入以原作为准。

文中提到的 SELF Protocol（作者 30+ 天单 Agent 实验）：内部 Knot Skill 33837 上架到 v1.6.7，**单样本、单 Agent、无对照组**，仅作为"我目前是这么应付的"贡献给讨论。

## 01 Agent Loop 真的挺香：核心主张 + 7 件套 + 4 个设计法

### 核心主张（一句）
**别再死磕 Prompt 怎么写了，去设计一个能让 AI 自己转起来的"循环（Loop）"。**

### 打比方
- 过去用 AI 像手动挡：每个路口都得自己换挡踩离合，一句句喂 Prompt
- Agent Loop 让你升级到自动驾驶：你只管输入目的地（目标）和限速（护栏），车自己开

### Agent Loop 7 件套

| 手册术语 | 大白话 | 解决什么 |
|---------|--------|---------|
| Automations | 定时闹钟，自动开跑 | 不用人每次手动点"开始" |
| Worktrees | 给每个 Agent 一个隔离工位 | 多 Agent 并行不打架（不互相覆盖文件） |
| Skills | 攒下来的"操作手册" | 不用每次从零教 AI |
| Plugins/Connectors | 外接工具（GitHub/Slack/MCP） | 让 Agent 真的能动手，而不是只会聊天 |
| Sub-agents | 一个干活、一个验收 | 防止 AI 自己给自己打高分 |
| Memory | 外挂笔记本 | 突破"聊几句就忘" |
| Guardrails | 限速 + 油量表 | 防止失控烧钱/原地打转 |

### 4 个设计法

**① 写循环之前，先想清楚"什么算干完了"（Stopping Condition）**

别说"把代码改好"——太模糊，AI 会把"我感觉改好了"当成"真改好了"；要说"写一个能复现 bug 的测试，然后让它通过"——可验证，AI 才知道什么时候该停。

> 这一条是整本手册最值钱的。模糊的目标会让 AI 自欺欺人，可验证的目标才是真护栏。

**② Context 是"组装出来的"，不是"写出来的"**

传统 Prompt 是一段固定文字。Loop 里 Context 是根据当前状态动态拼出来的——上一轮失败日志、当前文件树、最近 N 条调用记录，全自动拼进下一轮 Prompt。意味着你不再是"写 Prompt 的人"，而是"设计 Context 怎么自动生长"的人。

**③ 失败是输入，不是终点**

跑挂了？把错误堆栈、报错截图、上次 Diff 全自动喂回去当下一轮的输入。Loop 把"失败"重新定义成"用来下一步推理的数据"——这跟传统编程"出错就停"是反过来的思路。

**④ 多 Agent 协作有 6 种"拓扑"**

手册罗列 6 种多 Agent 编排模式：顺序流水线 / 协调者-工作者 / 扇出合并 / 生成-验证 / 共享状态 / 辩论对抗。每种都对应一类典型场景。相当于给"多 Agent 怎么搭"建了一个模式词典——看着场景挑一个就行。

## 02 读完之后改了我什么：4 处改变

| # | 改变 | 关键动作 |
|---|------|---------|
| 1 | 从"写 Prompt"心态切到"写循环 + 写 Stopping Condition"心态 | 第一反应变成"这件事怎么定义'干完了'" |
| 2 | 失败信息从"丢了"到"接住" | 强制自己把错误堆栈贴回下一轮 |
| 3 | 开始用"拓扑"观察工作 | 给文章纠错从"我自己 review"换"扇出合并"（两个 Agent 各挑刺） |
| 4 | 用 Loop 视角看清 SELF Protocol 在哪一层 | SELF 是治理/审查层薄壳协议 |

### SELF Protocol 对照 Loop 5 件套（治理相关）

| Loop 5 件套 | Loop 怎么做 | SELF 怎么做 | 诚实评估 |
|------------|------------|------------|---------|
| Memory | Markdown/DB 突破上下文窗口 | Markdown 三层分级 l0/l1/l2 + 答关键问题前强制翻笔记 | 30 天有效但仍有失焦案例（题 4） |
| Sub-agents | Maker-Checker 多 Agent | 单 Agent 内置"小查"角色卡（pre-publish review 清单：链接真假/数据出处/未核实声明） | 比"无验收"强，但同模型盲区共存（题 2） |
| Guardrails | 资源类（迭代/预算/无进展检测） | 加一层认知类（不胡说/不失忆/不污染记忆）+ 发布出口拦截 | 拦下过编造数据 1 次，红线触发率仍未稳（题 3） |
| Skills | 攒下来可复用的指令 | "失败转技能"（每个失败案例自动沉淀成可复用规矩） | 30 天攒了 9 条，但同类失败仍在反复犯（题 1） |
| Stopping Condition | 可验证的硬目标 | 软目标场景加"诚实分级 disclaimer"（论文级/工件级/计划级三档） | 治不了软目标本身，但至少不会假装"完成了" |

### 一句话定位

**Agent Loop 教我"怎么让 AI 自己转起来"，SELF 是我回答"转起来怎么不跑偏"的那一层薄壳**——前者是骨架，后者是润滑层；前者解决能不能转，后者解决转得稳不稳。

### 诚实声明
这张对照表是事后整理，不是说 SELF 一开始就照着 Loop 设计的——它是先在 30 天踩坑里长出来的（**268 次 LLM 调用 / 20 个失败案例 / 314 条学习记录**），读完 Loop 后才用它的语言把自己手上的东西"翻译"了一遍。所有"有效"都是个人体感、单 Agent 单样本、无对照组，普适性等更多人验证。

## 03 8 个还没想明白的问题（核心价值）

### 1. 停止条件遇到"软目标"怎么办？
"写测试-通过测试"硬目标容易写停止条件。"把这篇文章写得让人愿意读完"/"判断这个方案值不值得做"/"输出一份让老板满意的周报"是软目标。试过用 LLM 当 judge 给软目标打分（>0.7 就停），但两个 LLM 互打分有时会漂——**上午 0.85，下午同样的输出 0.6**。SELF 的土办法：加一道"诚实分级 disclaimer"——治不了软目标本身，但至少强制 Agent 显式标"这是计划级/我没法验证"。

### 2. 子代理"互相验收"，会不会同病相怜一起跑偏？
Maker-Checker（一个干活一个验收）听起来很美。但两个 Agent 都是同一个底模，盲区高度重合——**亲身试过：让 Agent A 写代码、Agent B 验收，B 把 A 的"看上去对其实有 off-by-one"的代码全都标了"PASS"**。是该用不同模型当 Checker？还是用规则引擎/单元测试当硬验收？

### 3. 护栏到底应该写在哪一层？
"预算上限/无进展检测/迭代次数封顶"应焊死在 Loop 框架里，还是做成可插拔的独立层？前者紧凑但写死之后改起来麻烦；后者灵活但灵活也意味着可能被"忘了启用"——**作者就忘开过一次，结果一晚上烧了几十块测试 token**。SELF 的分法：把"认知类护栏"做成可插拔的独立薄壳（认知红线常需迭代），把"资源类护栏"留给底层 Loop 框架（资源红线该写死）。

### 4. 记忆要给多大？
手册说用外挂记忆突破上下文窗口。但记忆给太大 Agent 会失焦（什么都翻一遍、容易被无关历史带偏），给太小又等于没解决问题。SELF 的土办法：分三层（l0/l1/l2），按需展开——但 30 天里仍有失焦案例。**按 token budget 截断？按相关性打分？还是按时间衰减？**

### 5. Loop 跑顺了之后，人对系统的理解会不会变浅？
手册自己警告"过度依赖会导致理解力腐蚀"——AI 越自动，人越不知道里面发生了什么；等到出 bug 时反而修不动。**作者自己就有这个体感——有几个搭的循环跑了两周后突然发现不太记得每一步在做什么，要重新读自己的代码**。重度用 AI 自动化之后，怎么对冲这种腐蚀？

### 6. 拓扑选型有没有"踩坑指南"？
手册给了 6 种多 Agent 拓扑，理论上每种都有适用场景。但真用起来怎么判断"我现在该选哪种"？**试过用"辩论对抗"（正反方 Agent 互相挑战）做风险评估，结果两个 Agent 互相说服反而比单 Agent 更糊涂——它们一起越聊越自信，最后一致同意一个错的结论**。哪些拓扑是看着美用着崩的？

### 7. AI 一本正经地胡说，怎么在 Loop 里防？
**这是栽得最惨的——Loop 跑得越自动，AI 错得也越自信**。有一次它笃定地告诉作者某个事实（甚至给出了"出处"），没核就用了，事后一查那个出处根本不存在，是它自己编的。SELF 的土办法：发布前自检清单（链接真假/数据出处/未核实结论），实测拦下过 1 次编造，但触发率还是不稳。**接外部检索强制核查？接独立的 fact-checker Agent？还是干脆白名单只让它输出特定结构？**

### 8. 成本怎么压？尤其在多 Agent + 长循环场景下
手册主要在讲"怎么让 Loop 跑起来"，但怎么让 Loop 跑得便宜这一面读得不解渴。**多 Agent 一并行 + 循环一拉长，token 烧得真的快**。作者的土办法：① 协调者用便宜模型只做路由 ② 中间产物存脚本变量不进 Prompt ③ 限制单循环最大轮数。**模型分级？Prompt 压缩？缓存中间结果？**

## 04 SELF Protocol：30 天数据 + 公开邀拍砖

### 它是什么 / 不是什么

| 维度 | SELF Protocol |
|------|--------------|
| 是什么 | 一层很薄的"白盒治理" Markdown 约定 + 少量 Python 脚本 · ~1500 行 · 单 Agent 实测 30+ 天 |
| 不是什么 | ❌ 不是新框架（不替代 Claude Harness/Agent Loop）/ ❌ 不接管你的 LLM 和工具集 / ❌ 不是产品，是一份开放协议 |
| 设计目标 | 让任何"已经在跑 Loop 的 Agent"加一层认知护栏（白盒记忆 / pre-publish 审查 / 失败转技能） |
| 当前形态 | Knot Skill 33837 · v1.6.7 · Close Beta（公司内可装可试可拍砖） |

### 三大模块（被真实坑逼出来的）

1. **白盒记忆治理**：Markdown 三层分级（l0/l1/l2）+ 答关键问题前强制翻笔记 → 治"失忆型胡答"（题 4）
2. **发布前自检**（pre-publish review）：链接真假 / 数据出处 / 未核实结论清单 → 治"一本正经的胡说"（题 7）
3. **失败转技能**：踩坑 → 沉淀成可复用规矩 → 治"重复掉同一个坑"（题 1）

### 30+ 天真实数据（单样本 · 公开邀拍砖）

- 268 次 LLM 调用
- 20 个失败案例
- 314 条学习记录
- 实测拦下"编造数据"事故 1 次（在自动周报循环里）
- **同类失败仍在反复犯**（说明本身有盲区）—— 这是诚实，不是宣传

### 安全承诺（Safe-Launch 模式 · 想试的同学不用怕被污染）

- 默认只读体检模式（5 分钟、零写入）
- 4 档入口按风险递增（只读 → 一次性 → 候选写入需拍板 → 长期托管）
- 输入"关闭 SELF"即停（零变更）
- 不污染既有 skill / 不默认建 cron

### 诚实声明（再说一遍）
所有"有效"都是个人体感、单 Agent 单样本、无对照组。普适性等更多人验证。作者放出来不是想推销，是想说"我目前是这么应付那 8 个问题的，你们怎么应付的？"——觉得有用就拿去拍，觉得没用就当看个反例。

## 05 最后（写作动机）

> 写这篇的真正目的，不是介绍 Agent Loop，也不是推 SELF——是想把上面 8 个问题摆出来，看看搞 Agent 的同学都怎么解的。SELF 只是目前的"答题草稿"，特别需要其他答题人的草稿做参照。

## 关联引用

→ [[entities/loop-engineering-addy-osmani-challengehub|Loop Engineering（Addy Osmani 若飞）]] — 同样是 Loop 范式但面向开发循环而非 Agent 自循环
→ [[entities/agent-harness-engineering-survey-2026|Harness Engineering Survey 2026]] — 同样社区层面的 Agent 工程化范式整理
→ [[entities/agent-harness-architecture-design-production-guide|Harness Architecture Production Guide]] — Harness 12 组件 vs Agent Loop 7 件套
→ [[entities/tencent-skill-writing-complete-playbook-jackjchou|腾讯 Skill 写作 Playbook]] — 同样腾讯系但讲 Skill 写作
→ [[entities/prompt-context-harness-three-evolutions-tencent|从 Prompt 到 Harness 工程三次进化]] — 同样腾讯系但讲进化论
→ [[raw/articles/agent-loop-engineering-handbook-8-questions-chen-jin-tencent-self-2026|原文存档]]