--- title: "读完 Agent Loop 工程手册,我有 8 个还没想明白的问题" source: "陈进 / 腾讯云开发者" source_url: "https://mp.weixin.qq.com/s/DtQ0FfSpUxYdRR8XOvppaw" ingested: 2026-06-16 sha256: "5293ebfb5c6870f44aad451fc2c6138ed31296fce11f4b2113bbad515644c077" type: raw tags: [agent, agent-loop, harness-engineering, multi-agent, memory, guardrails, stopping-condition, tencent-cloud, chen-jin, 2026, second-hand-interpretation, self-protocol] review_value: 8 review_confidence: 8 --- # 读完 Agent Loop 工程手册,我有 8 个还没想明白的问题 **作者**:陈进 | **公众号**:腾讯云开发者 | **发布时间**:2026-06-16 08:45 | **类型**:二手解读 + 30 天单 Agent 实验数据 ## 来源说明(重要) 文中提到的 Agent Loop:来源 = Peter Steinberger(OpenClaw 创始人)近期提出的"从写 Prompt 到设计 Loop"范式 + Boris Cherny(Claude Code 创始人)公开实践 + 社群整理的工程手册(Reddit / X 讨论量约 220 万)。作者读的是社群手册和公开讨论,**未接触作者原始全文,属二手解读**。如有出入以原作为准。 文中提到的 SELF Protocol(作者 30+ 天单 Agent 实验):内部 Knot Skill 33837 上架到 v1.6.7,**单样本、单 Agent、无对照组**,仅作为"我目前是这么应付的"贡献给讨论。 ## 01 Agent Loop 真的挺香:核心主张 + 7 件套 + 4 个设计法 ### 核心主张(一句) **别再死磕 Prompt 怎么写了,去设计一个能让 AI 自己转起来的"循环(Loop)"。** ### 打比方 - 过去用 AI 像手动挡:每个路口都得自己换挡踩离合,一句句喂 Prompt - Agent Loop 让你升级到自动驾驶:你只管输入目的地(目标)和限速(护栏),车自己开 ### Agent Loop 7 件套 | 手册术语 | 大白话 | 解决什么 | |---------|--------|---------| | Automations | 定时闹钟,自动开跑 | 不用人每次手动点"开始" | | Worktrees | 给每个 Agent 一个隔离工位 | 多 Agent 并行不打架(不互相覆盖文件) | | Skills | 攒下来的"操作手册" | 不用每次从零教 AI | | Plugins/Connectors | 外接工具(GitHub/Slack/MCP) | 让 Agent 真的能动手,而不是只会聊天 | | Sub-agents | 一个干活、一个验收 | 防止 AI 自己给自己打高分 | | Memory | 外挂笔记本 | 突破"聊几句就忘" | | Guardrails | 限速 + 油量表 | 防止失控烧钱/原地打转 | ### 4 个设计法 **① 写循环之前,先想清楚"什么算干完了"(Stopping Condition)** 别说"把代码改好"——太模糊,AI 会把"我感觉改好了"当成"真改好了";要说"写一个能复现 bug 的测试,然后让它通过"——可验证,AI 才知道什么时候该停。 > 这一条是整本手册最值钱的。模糊的目标会让 AI 自欺欺人,可验证的目标才是真护栏。 **② Context 是"组装出来的",不是"写出来的"** 传统 Prompt 是一段固定文字。Loop 里 Context 是根据当前状态动态拼出来的——上一轮失败日志、当前文件树、最近 N 条调用记录,全自动拼进下一轮 Prompt。意味着你不再是"写 Prompt 的人",而是"设计 Context 怎么自动生长"的人。 **③ 失败是输入,不是终点** 跑挂了?把错误堆栈、报错截图、上次 Diff 全自动喂回去当下一轮的输入。Loop 把"失败"重新定义成"用来下一步推理的数据"——这跟传统编程"出错就停"是反过来的思路。 **④ 多 Agent 协作有 6 种"拓扑"** 手册罗列 6 种多 Agent 编排模式:顺序流水线 / 协调者-工作者 / 扇出合并 / 生成-验证 / 共享状态 / 辩论对抗。每种都对应一类典型场景。相当于给"多 Agent 怎么搭"建了一个模式词典——看着场景挑一个就行。 ## 02 读完之后改了我什么:4 处改变 | # | 改变 | 关键动作 | |---|------|---------| | 1 | 从"写 Prompt"心态切到"写循环 + 写 Stopping Condition"心态 | 第一反应变成"这件事怎么定义'干完了'" | | 2 | 失败信息从"丢了"到"接住" | 强制自己把错误堆栈贴回下一轮 | | 3 | 开始用"拓扑"观察工作 | 给文章纠错从"我自己 review"换"扇出合并"(两个 Agent 各挑刺) | | 4 | 用 Loop 视角看清 SELF Protocol 在哪一层 | SELF 是治理/审查层薄壳协议 | ### SELF Protocol 对照 Loop 5 件套(治理相关) | Loop 5 件套 | Loop 怎么做 | SELF 怎么做 | 诚实评估 | |------------|------------|------------|---------| | Memory | Markdown/DB 突破上下文窗口 | Markdown 三层分级 l0/l1/l2 + 答关键问题前强制翻笔记 | 30 天有效但仍有失焦案例(题 4) | | Sub-agents | Maker-Checker 多 Agent | 单 Agent 内置"小查"角色卡(pre-publish review 清单:链接真假/数据出处/未核实声明) | 比"无验收"强,但同模型盲区共存(题 2) | | Guardrails | 资源类(迭代/预算/无进展检测) | 加一层认知类(不胡说/不失忆/不污染记忆)+ 发布出口拦截 | 拦下过编造数据 1 次,红线触发率仍未稳(题 3) | | Skills | 攒下来可复用的指令 | "失败转技能"(每个失败案例自动沉淀成可复用规矩) | 30 天攒了 9 条,但同类失败仍在反复犯(题 1) | | Stopping Condition | 可验证的硬目标 | 软目标场景加"诚实分级 disclaimer"(论文级/工件级/计划级三档) | 治不了软目标本身,但至少不会假装"完成了" | ### 一句话定位 **Agent Loop 教我"怎么让 AI 自己转起来",SELF 是我回答"转起来怎么不跑偏"的那一层薄壳**——前者是骨架,后者是润滑层;前者解决能不能转,后者解决转得稳不稳。 ### 诚实声明 这张对照表是事后整理,不是说 SELF 一开始就照着 Loop 设计的——它是先在 30 天踩坑里长出来的(**268 次 LLM 调用 / 20 个失败案例 / 314 条学习记录**),读完 Loop 后才用它的语言把自己手上的东西"翻译"了一遍。所有"有效"都是个人体感、单 Agent 单样本、无对照组,普适性等更多人验证。 ## 03 8 个还没想明白的问题(核心价值) ### 1. 停止条件遇到"软目标"怎么办? "写测试-通过测试"硬目标容易写停止条件。"把这篇文章写得让人愿意读完"/"判断这个方案值不值得做"/"输出一份让老板满意的周报"是软目标。试过用 LLM 当 judge 给软目标打分(>0.7 就停),但两个 LLM 互打分有时会漂——**上午 0.85,下午同样的输出 0.6**。SELF 的土办法:加一道"诚实分级 disclaimer"——治不了软目标本身,但至少强制 Agent 显式标"这是计划级/我没法验证"。 ### 2. 子代理"互相验收",会不会同病相怜一起跑偏? Maker-Checker(一个干活一个验收)听起来很美。但两个 Agent 都是同一个底模,盲区高度重合——**亲身试过:让 Agent A 写代码、Agent B 验收,B 把 A 的"看上去对其实有 off-by-one"的代码全都标了"PASS"**。是该用不同模型当 Checker?还是用规则引擎/单元测试当硬验收? ### 3. 护栏到底应该写在哪一层? "预算上限/无进展检测/迭代次数封顶"应焊死在 Loop 框架里,还是做成可插拔的独立层?前者紧凑但写死之后改起来麻烦;后者灵活但灵活也意味着可能被"忘了启用"——**作者就忘开过一次,结果一晚上烧了几十块测试 token**。SELF 的分法:把"认知类护栏"做成可插拔的独立薄壳(认知红线常需迭代),把"资源类护栏"留给底层 Loop 框架(资源红线该写死)。 ### 4. 记忆要给多大? 手册说用外挂记忆突破上下文窗口。但记忆给太大 Agent 会失焦(什么都翻一遍、容易被无关历史带偏),给太小又等于没解决问题。SELF 的土办法:分三层(l0/l1/l2),按需展开——但 30 天里仍有失焦案例。**按 token budget 截断?按相关性打分?还是按时间衰减?** ### 5. Loop 跑顺了之后,人对系统的理解会不会变浅? 手册自己警告"过度依赖会导致理解力腐蚀"——AI 越自动,人越不知道里面发生了什么;等到出 bug 时反而修不动。**作者自己就有这个体感——有几个搭的循环跑了两周后突然发现不太记得每一步在做什么,要重新读自己的代码**。重度用 AI 自动化之后,怎么对冲这种腐蚀? ### 6. 拓扑选型有没有"踩坑指南"? 手册给了 6 种多 Agent 拓扑,理论上每种都有适用场景。但真用起来怎么判断"我现在该选哪种"?**试过用"辩论对抗"(正反方 Agent 互相挑战)做风险评估,结果两个 Agent 互相说服反而比单 Agent 更糊涂——它们一起越聊越自信,最后一致同意一个错的结论**。哪些拓扑是看着美用着崩的? ### 7. AI 一本正经地胡说,怎么在 Loop 里防? **这是栽得最惨的——Loop 跑得越自动,AI 错得也越自信**。有一次它笃定地告诉作者某个事实(甚至给出了"出处"),没核就用了,事后一查那个出处根本不存在,是它自己编的。SELF 的土办法:发布前自检清单(链接真假/数据出处/未核实结论),实测拦下过 1 次编造,但触发率还是不稳。**接外部检索强制核查?接独立的 fact-checker Agent?还是干脆白名单只让它输出特定结构?** ### 8. 成本怎么压?尤其在多 Agent + 长循环场景下 手册主要在讲"怎么让 Loop 跑起来",但怎么让 Loop 跑得便宜这一面读得不解渴。**多 Agent 一并行 + 循环一拉长,token 烧得真的快**。作者的土办法:① 协调者用便宜模型只做路由 ② 中间产物存脚本变量不进 Prompt ③ 限制单循环最大轮数。**模型分级?Prompt 压缩?缓存中间结果?** ## 04 SELF Protocol:30 天数据 + 公开邀拍砖 ### 它是什么 / 不是什么 | 维度 | SELF Protocol | |------|--------------| | 是什么 | 一层很薄的"白盒治理" Markdown 约定 + 少量 Python 脚本 · ~1500 行 · 单 Agent 实测 30+ 天 | | 不是什么 | ❌ 不是新框架(不替代 Claude Harness/Agent Loop)/ ❌ 不接管你的 LLM 和工具集 / ❌ 不是产品,是一份开放协议 | | 设计目标 | 让任何"已经在跑 Loop 的 Agent"加一层认知护栏(白盒记忆 / pre-publish 审查 / 失败转技能) | | 当前形态 | Knot Skill 33837 · v1.6.7 · Close Beta(公司内可装可试可拍砖) | ### 三大模块(被真实坑逼出来的) 1. **白盒记忆治理**:Markdown 三层分级(l0/l1/l2)+ 答关键问题前强制翻笔记 → 治"失忆型胡答"(题 4) 2. **发布前自检**(pre-publish review):链接真假 / 数据出处 / 未核实结论清单 → 治"一本正经的胡说"(题 7) 3. **失败转技能**:踩坑 → 沉淀成可复用规矩 → 治"重复掉同一个坑"(题 1) ### 30+ 天真实数据(单样本 · 公开邀拍砖) - 268 次 LLM 调用 - 20 个失败案例 - 314 条学习记录 - 实测拦下"编造数据"事故 1 次(在自动周报循环里) - **同类失败仍在反复犯**(说明本身有盲区)—— 这是诚实,不是宣传 ### 安全承诺(Safe-Launch 模式 · 想试的同学不用怕被污染) - 默认只读体检模式(5 分钟、零写入) - 4 档入口按风险递增(只读 → 一次性 → 候选写入需拍板 → 长期托管) - 输入"关闭 SELF"即停(零变更) - 不污染既有 skill / 不默认建 cron ### 诚实声明(再说一遍) 所有"有效"都是个人体感、单 Agent 单样本、无对照组。普适性等更多人验证。作者放出来不是想推销,是想说"我目前是这么应付那 8 个问题的,你们怎么应付的?"——觉得有用就拿去拍,觉得没用就当看个反例。 ## 05 最后(写作动机) > 写这篇的真正目的,不是介绍 Agent Loop,也不是推 SELF——是想把上面 8 个问题摆出来,看看搞 Agent 的同学都怎么解的。SELF 只是目前的"答题草稿",特别需要其他答题人的草稿做参照。 ## 关联引用 → [[entities/loop-engineering-addy-osmani-challengehub|Loop Engineering(Addy Osmani 若飞)]] — 同样是 Loop 范式但面向开发循环而非 Agent 自循环 → [[entities/agent-harness-engineering-survey-2026|Harness Engineering Survey 2026]] — 同样社区层面的 Agent 工程化范式整理 → [[entities/agent-harness-architecture-design-production-guide|Harness Architecture Production Guide]] — Harness 12 组件 vs Agent Loop 7 件套 → [[entities/tencent-skill-writing-complete-playbook-jackjchou|腾讯 Skill 写作 Playbook]] — 同样腾讯系但讲 Skill 写作 → [[entities/prompt-context-harness-three-evolutions-tencent|从 Prompt 到 Harness 工程三次进化]] — 同样腾讯系但讲进化论 → [[raw/articles/agent-loop-engineering-handbook-8-questions-chen-jin-tencent-self-2026|原文存档]]