---
title: "吴恩达三层Loop：Agent越快，人越要管慢反馈"
source_url: "https://mp.weixin.qq.com/s/PGpe6EnVNnig2cuZ9VbnuA"
ingested: 2026-07-03
sha256: cab38c66506a628b2162e122bfc41b7623fc675da3845a153b2e31719f500616
author: 若飞
publisher: 架构师
---

最近几周，Loop Engineering 这个词越来越热。

Peter Steinberger 的说法很直接：重点会从一轮轮提示 Coding Agent，转向设计"提示 Agent 的循环"。Boris Cherny 那句"我的工作是写 loop"，也被很多人反复引用。

放在《架构师》今年一直梳理的 Agent 工程里，这个转向并不突然。

前面几个月，我们基本沿着同一条线往前走：先拆 Coding Agent 外面的仓库上下文、工具、状态、记忆、子 Agent 和权限；再看 Harness 怎么把 Agent 接进可观察、可恢复、可追踪的工作现场；最近聊 Loop Engineering，重点则落到反馈循环、停止条件、状态账本和反馈契约。

吴恩达在 The Batch 里把这条线又往外推了一层。

他的重点从"代码怎么自己改好"，移到了"产品怎么从 0 到 1 长出来"。

这个角度值得单独看。

当 Agent 把最内层工程循环压到分钟级，稀缺能力并没有消失，只是往外迁移了：人要把模糊愿景翻译成规格，也要从真实世界拿回反馈，再修正愿景。

Agent 越快，人越要管慢反馈。

三层 Loop

吴恩达把 0 到 1 产品开发拆成三层：

• Agentic coding loop：分钟级。Agent 根据规格写代码、测试、修复，再继续迭代。
• Developer feedback loop：几十分钟到几小时。开发者看当前产品，调整规格、交互、功能范围和下一步方向。
• External feedback loop：小时到数天，甚至数周。真实用户、Alpha / Beta、A/B Test、市场变化，把信号带回产品愿景。

放进我们最近这条 Loop Engineering 线索里看，三层 Loop 补上了一条更完整的链路：内层看代码能不能跑起来，中间看规格是不是还对，外层看这个问题还值不值得继续做。

很多讨论容易停在最内层。让 Agent 自己跑测试、自己修 Bug、自己开浏览器检查页面，这些都很有价值，但它们主要解决的是一个已知目标怎么更快完成。

更麻烦的往往是另外两个问题：

目标本身怎么变清楚？

真实用户回来以后，目标又该怎么改？

放到产品开发里看，三层 Loop 不太像三个并列流程，更像三种时间尺度上的接口。

愿景变成规格，规格变成代码，代码变成证据，证据再回到人的判断。外部反馈回来以后，又要重新改愿景、改规格、改验证方式。

这条链如果断了，最内层跑得越快，偏差也可能积累得越快。

图 1：三层 Loop 的时间尺度和交接方向

内层快了，但方向不会自动变对

最熟悉的是 Agentic coding loop。

给 Agent 一份产品规格，再配一组可以验收的评测或测试，它可以写代码、跑测试、发现问题、继续修，直到结果符合规格。

这和我们前面聊 /goal 时的判断很接近：一个可运行的目标，不能只写"把它做好"。范围、不变量、验证方式、预算边界和停止条件，都要尽量放进去。

吴恩达在原文里举了一个周末做打字练习应用的例子。Coding Agent 可以自己工作大约一小时，还会多次用浏览器检查自己做出来的东西，再回来汇报。

这种体验正在变得常见。

Addy Osmani 在 Loop Engineering 长文里拆得更工程化一点：自动化负责触发循环，worktree 负责隔离并行任务，skills 负责沉淀项目知识，connector 负责连接真实工具，sub-agent 负责把"做"和"查"拆开，状态文件负责记住这一轮做了什么。

这些部件听起来琐碎，但它们对应的是今年反复出现的几个老问题：工作现场怎么隔离，过程资产怎么沉淀，验证者怎么独立，状态怎么交接。

少一块，循环未必跑不起来，只是后面容易变成"看起来一直在推进，实际很难接手"。

这里要补一个边界：Agentic coding loop 再顺，也只是在规格内部迭代。它能把"怎么做"压快，却不知道"该不该做"。

一个规格写错了，Agent 可能会非常认真地把错误规格实现得很完整。

所以，把 Loop Engineering 只理解成"让 Agent 一直跑"，会漏掉最关键的约束。没有验证、状态、权限和停止条件，循环会把问题放大；没有更外层反馈，循环会把错误方向做得更精致。

人的位置，是上下文接口

吴恩达这封信里，我最喜欢的一个说法，是他把"品味"换成了"上下文优势"。

很多人会说，人类在产品上比 AI 强，是因为人有品味。这个说法没错，但有点玄。品味很难传递，也很难调试。

"上下文优势"更适合工程团队理解。

上下文可以拆开成很多具体信息：用户是谁，在什么场景里用，业务边界在哪里，哪些约束不能碰，竞争对手最近做了什么，团队过去踩过哪些坑，哪些方向已经验证过，哪些只是直觉。

这些信息现在大多还在人脑里，或者散落在会议、工单、文档、客户聊天记录里。Agent 并不知道。

所以 Developer feedback loop 的关键，不是人继续给 Agent 当 QA。

去年很多开发者还在亲自找 Bug，再让 Agent 修。现在 Agent 自测能力强了以后，人花在低层 QA 上的时间会下降。人的工作会往上走：看第一版产品，判断功能范围是否合理，交互是否顺，规格是否需要改，愿景本身是否要调整。

这件事放到架构师视角里，意思很直接。

以前我们常说，把业务需求翻译成系统设计。现在中间多了一层：把产品愿景翻译成 Agent 能执行、能验证、能回滚的规格。

这里的规格不只是 prompt。

一份能交给 Agent 长时间执行的规格里，通常会有目标、非目标、用户场景、不变量、验收证据、权限边界、预算边界，以及这轮循环什么时候该停。

这些内容写清楚以后，Agent 才不是靠猜在补洞。团队也能在下一轮回看：当时为什么这么做，哪些判断后来被证伪了，哪些约束还有效。

我们之前梳理 Harness 时，也反复遇到这个问题：Agent 真要进入团队流程，很多上下文最后会落到仓库规则、Skill、Runbook、权限策略、状态文件和 trace 里，而不是只留在一次对话里。

慢反馈最容易被省掉

第三层是 External feedback loop。

这层最慢，也最容易被忽略。

找几位真实用户试用，收集反馈，做 Alpha 或 Beta，放到生产环境里做 A/B Test，看数据和用户行为。这些事情很少几个小时就能完成，有时要等几天，甚至几周。

在今天这个节奏里，它显得很慢。

但它承担的纠偏价值最高。因为前两层都发生在系统内部：Agent 按规格写代码，开发者按自己的理解改规格。只要产品还没有碰到真实用户，很多判断仍然只是想象。

吴恩达提到一个细节：外部数据的路径更长，先影响 developer vision，再影响 detailed spec，最后才驱动 coding agent。

这条顺序决定了反馈能不能进入下一轮。

真实用户反馈回来以后，如果只是停留在会议纪要里，或者被 AI 总结成"用户希望体验更好"，它没有进入系统。

它要变成新的产品判断，新的规格约束，新的验收方式，甚至新的非目标。这样下一轮 Coding Loop 才会真的改变。

AI 可以帮我们收集、清洗、归纳这些信号，但信号本身不能靠模型脑补。

这个判断我还不想说得太满。不同团队、不同产品、不同组织分工，变化一定不一样。

但方向上我认同：当实现速度被压缩，产品判断、用户理解和外部反馈会变得更贵。

一个团队如果只升级了最内层 Coding Loop，却没有升级外层反馈机制，很可能每天产出很多版本，内部看起来都完整，真实用户反馈回来以后，才发现方向一直没对齐。

问题往往不在 Agent；慢反馈没有进系统，偏差就不会自动消失。

图 2：慢反馈进入系统的路径

三层之间，要有交接物

换成架构师更熟悉的语言，吴恩达的三层 Loop 可以这样理解。

Agentic coding loop 是执行面，负责把规格变成可运行的软件。这一层要看测试、浏览器检查、静态分析、日志、沙箱、权限和停止条件。

Developer feedback loop 是产品控制面，负责把人的上下文、判断和取舍写回规格。这一层的产物不只是 prompt，更像可版本化的规格、验收标准、非目标、约束条件和决策记录。

External feedback loop 是环境反馈面，负责把真实世界的信号带回来。用户行为、访谈、支持工单、竞品变化、市场约束，都会改变团队对问题的理解。

这三层可以先粗略放成这样：

层级 | 输出产物 | 需要留下的证据
执行面 | 代码变更、测试结果、运行日志 | 测试、截图、指标、diff
产品控制面 | 新规格、取舍记录、非目标 | 人工评审、决策记录、可复现问题
环境反馈面 | 愿景修正、优先级调整 | 用户数据、反馈样本、A/B 结果

这张表不是为了把产品开发变成流程表。

它只是在说一件事：每层 Loop 的输出，最好能被下一层读懂。

这也是我们最近反复讨论输入、权限、验证、停止、反馈契约和状态交接的原因。它们都在给工程内循环打桩。

这些文章主要解决的是第一层，以及第二层里比较偏工程的部分。

吴恩达这封信把剩下的部分推出来了：第二层和第三层也需要一点工程化。重点不在把产品判断做成流水线，重点在让愿景、规格、证据和真实用户反馈之间有一条能回看的路径。

落到团队里，先收小

落到普通团队里，一开始没必要搭复杂平台。

可以先用一个低风险场景跑一周，比如内部工具的小功能、管理台页面的体验优化、一段可回滚的批处理，或者一次文档到测试的补齐。

核心交易链路、权限系统、线上事故修复这类事，可以等团队把状态、证据、权限和回滚跑顺以后再纳入。

试跑时，三份轻量记录就够了。

SPEC 写清这轮要改变什么，哪些事情先不碰，用户和场景是什么，哪些接口、数据、权限、体验不能破坏，最后用什么证据验收。

STATE 记录当前基线、已经尝试过的方案、已经通过的验证、暂时否掉的路径，以及下一轮从哪里继续。Addy 提到的 state file，说的就是这类东西。它不花哨，但长任务很需要它。

FEEDBACK 记录真实世界回来什么信号：来自访谈、工单、埋点、A/B，还是销售反馈；证据强度如何；它影响愿景、规格、验证，还是只影响文案。

这三份记录的价值不在格式，而在交接。

如果交接物写不出来，也许说明这层循环还不适合急着自动化。

图 3：团队试跑一周时的三份交接物

几个边界

Loop 跑起来以后，团队最先感受到的通常是速度。

但速度只是体感，问题往往藏在接口里。

内层 Coding Loop 做得很漂亮，外层反馈没进来，团队会得到一堆内部自洽的版本。

上下文只留在临时聊天里，几轮之后就很难复盘：哪些是事实，哪些只是某个人当时的判断。

自写自审很顺手，质量门槛也会悄悄变松。一个写代码的模型，天然更容易相信自己的解释。这里我更倾向于 maker/checker 分离：实现和验收用不同上下文、不同指令，必要时甚至用不同模型。

还有一个不太显眼的问题是成本和可理解性。

sub-agent、长循环、定时任务都会消耗 token，也会制造审查压力。更麻烦的是，如果长寿命代码在没人理解的情况下持续被循环修改，团队会慢慢欠下理解债。

Armin Ronacher 在《The Coming Loop》里提醒过一个很现实的问题：今天的模型容易做局部防御，看到一个失败就补一个 fallback，久而久之系统看起来更稳，实际变得更难理解。

这个担心我很认同，也和我们在《架构排熵：Loop Engineering 的持续清理系统》里聊过的问题是同一类：Agent 会加速产出，也会加速复杂度沉积。

所以，Loop 更适合先放在实验、迁移、性能探索、安全扫描这类可验证、短寿命或者机械转换任务里。对核心链路、持久化数据结构、权限系统、计费系统这类长期资产，Loop 可以参与，但不变量、设计边界和代码可理解性，仍然由人来把关。

不然，循环会把复杂度也自动化。

想想，也挺可怕的。。。

最后

Loop Engineering 这波讨论，表面上是 prompt 工作方式变了。

更深一层看，它是在重新分配软件开发里的时间尺度。

过去，人几乎卡在每一步实现里。现在最内层实现循环越来越快，人开始被推到更外层：写清目标，补足上下文，设计反馈，判断什么时候继续，什么时候停。

这并不轻松。

内层快了，外层慢反馈反而更容易被忽视。团队很容易沉迷在"今天又让 Agent 跑了多少轮"，却忘了问：这些轮次有没有让我们更接近真实用户的问题？

我的理解会更保守一点。

Agentic coding loop 值得用，但它只是三层系统里的最内层。我更关注三层之间的接口：愿景怎么变规格，规格怎么变验证，验证怎么变证据，证据怎么回到下一轮判断，真实用户反馈又怎么修正愿景。

等这些接口清楚以后，Loop 才会从单纯自动化，往产品开发系统靠近：能持续学习，能被接手，也能及时停下来。

参考资料
• DeepLearning.AI / The Batch：Three Key Loops for Building Great Software
https://www.deeplearning.ai/the-batch/three-key-loops-for-building-great-software
• Andrew Ng X 帖
https://x.com/AndrewYNg/status/2071988145667928442
• Peter Steinberger X 帖
https://x.com/steipete/status/2063697162748260627
• Addy Osmani：Loop Engineering
https://addyosmani.com/blog/loop-engineering/
• Armin Ronacher：The Coming Loop
https://lucumr.pocoo.org/2026/6/23/the-coming-loop/
• Business Insider：Forget prompt engineering: 'Loop engineering' is all the rage now
https://www.businessinsider.com/what-are-loops-ai-engineering-tips-2026-6