--- source_url: "https://mp.weixin.qq.com/s/5sftvwAZL4Hj5v40HZ1rVw" ingested: 2026-06-26 sha256: 02d730ea5a5ccaf8 --- sha256: dc1804caf4657c29 --- title: Agent 的骨架:一文讲透 Agent Runtime — 二曲线工程师 7 职责 + 3 主流框架 source_url: https://mp.weixin.qq.com/s/5sftvwAZL4Hj5v40HZ1rVw author: 二曲线工程师 publisher: 工程师的第二曲线 publish_time: 2026-06-05 21:50 related_series: Agent 工程系列第 04 篇 (前 3 篇: Loop / Context / Tool Calling,后 9 篇: Memory / Trace / HITL / Eval / Multi-Agent / Planning / RAG / Prompt Engineering / 安全) related_first_source: claude-fable-5-agent-runtime-contract-ruofei-2026 (若飞 Runtime Contract 框架) ingested: 2026-06-15 type: raw sources: [] review_value: 7 review_confidence: 7 review_recommendation: worth-reading review_stars: 3 char_count: 3095 sha256: bd1511b115a00953ec596526344dc585d01894c504b7c1cf6ff98568ef28e5a4 notes: | 「工程师的第二曲线」Agent 工程系列第 04 篇,讲 Agent Runtime 7 大职责 + 3 主流框架对比。 定位:通用 Agent Runtime 概念入门视角;与若飞 Runtime Contract 框架(深度工程协议视角)互补不重叠。 短小精悍(3095 字符),系列关联强(后续 9 篇),对构建完整 Agent Runtime 知识体系是入门必备。 --- # Agent 的骨架:一文讲透 Agent Runtime **公众号**: 工程师的第二曲线 (作者: 二曲线工程师) | **发布时间**: 2026-06-05 21:50 **系列**: Agent 工程系列第 04 篇(前 3 篇: Agent Loop / Context Engineering / Tool Calling;后 9 篇: Memory / Trace / HITL / Eval / Multi-Agent / Planning / RAG / Prompt Engineering / 安全 Guardrail) --- > **一句话定义**: Runtime 是驱动 Agent Loop 运转的**执行框架**,负责把 LLM、工具、状态、权限和日志串成一个可运行的系统。**LLM 是引擎,Runtime 是底盘。没有底盘,引擎再好也上不了路。** ## 一、Runtime 是什么 写好了 Agent Loop,LLM 接好了,工具也写好了。跑起来之后发现的真实困境: - 工具调用失败了,没人处理,Loop 直接崩 - 跑了十几轮还没结束,没有终止条件 - 出了问题想排查,没有任何日志 - 某个敏感操作被 LLM 随意调用,没有权限控制 > **代码能跑,但像一辆没有底盘的车——引擎有了,但传动、刹车、仪表盘全都缺。这些"脏活",就是 Agent Runtime 负责的事。** ## 二、Runtime 具体负责什么 如果说 Agent Loop 是循环,Context Engineering 是每轮喂给模型的信息,Tool Calling 是模型伸向外部的手,那么 **Runtime 就是负责调度这一切的执行层**。 把 Runtime 的职责拆开来看,**通用 Agent 里至少有这七件事**: ### 2.1 工具管理 (ToolRegistry) Runtime 统一注册和管理工具,并把当前可用工具的 schema 提供给模型;**模型只需要基于这些描述决定是否调用,不需要知道工具怎么实现的**。 ### 2.2 上下文组装 每轮调用 LLM 之前,Runtime 负责把 System Prompt、执行历史、工具定义、当前状态**拼成完整的 Context 塞给模型**。**这是 Context Engineering 的执行层**。 ### 2.3 状态管理 (State) 当前跑到第几轮、已经收集了哪些信息、任务进展如何——**这些运行时状态由 Runtime 维护,不是 LLM 的事**。**LLM 每次调用都是无状态的,状态要靠外部系统保存**。 ### 2.4 终止判断 Agent Loop 什么时候停?**4 类终止条件**: - 达到最大轮数 - 模型返回最终答案 - 不再请求工具调用 - 工具连续失败 **Runtime 负责执行这些终止逻辑**。没有明确的终止条件,Loop 就可能无限跑下去。 ### 2.5 风险控制 (Guardrail) 哪些操作需要人工审批?哪些工具有调用频率限制?哪些参数需要脱敏处理? **Runtime 在 LLM 和工具执行之间做一层拦截,防止 Agent 做出不该做的事**。 ### 2.6 Trace (链路追踪) 每一轮发生了什么、LLM 输出了什么、工具返回了什么——**Runtime 把这些信息记录成完整的执行链路**。**没有 Trace,出了问题就是黑盒,什么都查不了**。 ### 2.7 可观测性 (Observability) 基于 Trace 数据,能实时看到 Agent 的运行状态、历史行为、异常信号。**Trace 是记录,Observability 是在这些记录上建立的"眼睛"**。这两者会在后续文章单独展开。 ### 2.8 (复杂 Agent 额外层) 路由 (Router) 当 Agent 需要处理多种不同类型的任务时,Router 负责判断用户意图、分发到对应的 workflow。**简单 Agent 可以不单独设计 Router,由提示词和工具选择承担简单分发;复杂 Agent 有多个 workflow 时,才需要显式路由**。 ## 三、没有 Runtime 会怎样 **没有 Runtime 的 Agent**: ```python while True: action = llm.call(context) result = tool.run(action) context.append(result) ``` **能跑,但**: - 工具失败直接抛异常 - 没有日志 - 没有权限控制 - 不知道什么时候结束 - 出了问题无从排查 **这是一个脚本,不是一个系统。** **有 Runtime 的 Agent**: **同样的 Loop,但每一步都有人兜底**——工具调用前校验权限,执行结果写入 Trace,异常触发重试或终止,敏感操作等待人工确认。 **这才是一个可以交付、可以维护、可以信任的系统。** ## 四、主流框架的 Runtime 长什么样 **LangGraph**: 以图结构组织 workflow,**节点是 LLM 调用或工具执行,边是状态转移**。适合流程复杂、分支多的 Agent。 **OpenAI Agents SDK**: Runner 驱动 Loop,tools 统一注册,**内置 handoff 机制支持多 Agent 协作**。接口简洁,上手快。 **自研 Runtime**: 可控性最强,可以按需裁剪每一个模块,代价是要自己处理所有工程细节。**适合对系统有深度定制需求的场景**。 > **框架选哪个,取决于你的场景复杂度和对可控性的要求。但无论选哪个,背后解决的都是同一批问题。** ## 最后说一句 > 理解了 Runtime,你就理解了为什么 Agent 开发**不只是"调 LLM API"**。 **LLM 可以被替换,但不是无成本的替换**:不同模型的工具调用格式、上下文窗口、推理风格和稳定性都会影响系统表现。**Runtime 的价值在于,把这些差异尽量封装起来,让 Agent 系统更稳、更安全、更好维护。** 下一篇,拆 **Memory 体系**——Agent 怎么记住东西,短期记忆、Working Memory 和长期存储各自怎么设计。 ## 系列导览 (13 篇) | 编号 | 主题 | 状态 | |------|------|------| | 01 | Agent 为什么会"自己干活"?一文讲透 Agent Loop | ✅ 已发布 | | 02 | Context Engineering: Agent 真正的难点在这里 | ✅ 已发布 | | 03 | Agent 的手:一文讲透 Tool Calling | ✅ 已发布 | | 04 | **Agent 的骨架:一文讲透 Agent Runtime** | 📍 本篇 | | 05 | Agent 的记忆:一文讲透 Memory 体系 | 即将发布 | | 06 | Agent 的黑匣子:一文讲透 Trace 与可观测性 | 即将发布 | | 07 | Agent 的刹车:一文讲透 HITL | 即将发布 | | 08 | 给 Agent 打分:一文讲透 Eval | 即将发布 | | 09 | Agent 的分工:一文讲透 Multi-Agent | 即将发布 | | 10 | Agent 怎么想清楚再动手:一文讲透 Planning | 即将发布 | | 11 | Agent 的外部记忆:一文讲透 RAG | 即将发布 | | 12 | Agent 的行为说明书:一文讲透 Prompt Engineering | 即将发布 | | 13 | Agent 的防护网:一文讲透安全与 Guardrail | 即将发布 |