--- title: "别再亲自写Prompt了!OpenClaw与Claude Code创始人已经用'循环'让一堆Agent自动打工了" created: 2026-06-09 updated: 2026-06-09 type: article source_url: "https://mp.weixin.qq.com/s/5Hy4ctKOq8Iq7m2bqy45zQ" ingested: 2026-06-09 sha256: "a1b2c3d4e5f67890" review_value: 7 review_confidence: 8 --- > 来源:51CTO技术栈 > 作者:玉澄(编辑) > 原文:https://mp.weixin.qq.com/s/5Hy4ctKOq8Iq7m2bqy45zQ ## 摘要 OpenClaw 创始人 Peter Steinberger 的一条推文让整个 AI Coding 圈为之热议,阅读量冲到 650 万人次。Claude Code 创始人 Boris Cherny 也在近期表示自己用循环来提示 Agent。Matt Van Horn 对"循环"做了深入研究,认为如今真正昂贵的不是模型,而是循环。 ## Steinberger 说的"循环"到底指什么?Boris 有答案 Boris Cherny 描述:"现在,我不再需要向 Claude 发出指令了。有一些循环在持续运行着,正是这些循环在向 Claude 发出指令,并决定它该做什么。我的任务就是编写这些循环而已。" 简单来说,一个"循环"就是你编写的一个小程序,它会替你向 Coding Agent 发出提示,读取其输出结果,判断是否完成,如果未完成则会再次进行提示。你变成了循环的创造者,模型变成了一个子程序。 Boris 的进化三阶段: 1. 一年前:手动编写代码,使用自动补全 2. 同时运行五到十个 Claude 会话分别提示 3. 现在:编写提示 Claude 的循环,几百个 Agent 读取他的 GitHub、Slack 和 Twitter,并决定接下来要做什么 ## 五级跃迁史:从 While 循环到多 Agent 编排循环 **第一阶段**:学术界的 While 循环(2022 ReAct 论文) - 模型进行推理,调用工具,读取结果,循环往复直至完成 - 一个模型,一个循环,一个人在旁注视 **第二阶段**:AutoGPT(2023) - 被赋予目标并允许自行生成提示词 - 因一直处于"空转状态"而闻名 - 埋下"智能体是玩具"观点的种子 **第三阶段**:Ralph 循环(2025年7月 Geoffrey Huntley) - 简单的 Bash 命令,将同一个提示文件一遍又一遍地通过管道传入代理 - 创新在于纪律性:每次迭代都将上下文重置为固定锚定文件 - Huntley 仅花约 297 美元就用它构建了一整套编程语言 **第四阶段**:产品化(2026年春季) - Codex 和 Claude Code 推出 /goal 命令 - 持续运行 Ralph 循环直至验证模型确认任务完成 **第五阶段**:Boris 和 Steinberger 真正所指 - 循环成为工作单元,而非任务 - 循环并行、按计划监督其他循环 - 计划调度取代人工启动 - 基于 Git 的状态管理和崩溃恢复机制 ## Boris 的循环实操指南 5 条让 Opus 系统自动运行数小时或数天的技巧: 1. 使用 auto mode 处理权限问题 2. 使用动态工作流让 Claude 协调数百或数千个 Agent 完成任务 3. 使用 /goal 或 /loop 推动 Claude 持续执行直至任务完成 4. 在云端使用 Claude Code,可以合上笔记本电脑 5. 确保 Claude 能够对工作进行端到端的自我验证 ## 编程新阶段:最贵的不再是模型调用,而是循环管控 一旦模型编写代码几乎不花费什么,成本就转移到了运行它的循环上。Uber 在四个月内就耗尽年度 AI 预算,不得不对 Claude Code 和 Cursor 进行限制(每位工程师每月每使用一个工具只能花费 1500 美元)。 2026 年所有关于循环的严肃论述都指向三个共同的硬性限制: - 最大迭代次数 - 无进展检测 - Token 或资金预算上限 循环的浪漫版本是:你编写好循环,一千个智能体就能在一夜之间帮你建立公司。现实版本则是:大部分工作都花在确保它们及时停止上。 ## 循环增值的关键:可复用的技能 Steinberger 的观点:如果你做某件事超过一次,就将其转化为自动化技能;如果你做某件困难的事,事后将其转化为技能,这样下次做起来就更轻松。 循环是管道机制,所谓的资产是它所调用的技能。一个内部没有可复用技能的循环,不过是一个"空转"的 while-true 循环。 ## 最终复盘:三大核心新逻辑 1. 一个循环其实相当于 Cron 加上一个决策机制:每个时间点上,都是模型来决定下一步该执行什么操作 2. 最昂贵的资源从 Token 转移到了循环管理上。需要限制迭代次数、检测无进展情况,并设定预算上限 3. 循环中的可复用单元是技能,而不是提示词。循环调用明确命名的技能会产生复合效益 ## 参考链接 - Matt Van Horn 推文:https://x.com/mvanhorn/status/2063865685558903149