--- source_url: "https://mp.weixin.qq.com/s/a10NnBuBDmaStoDZjOhzjA"" ingested: 2026-06-26 sha256: 684ac42eee594f81 --- sha256: 3a6e2c03654a05d3 --- title: "Agent Harness 架构设计与实现:生产级 Agent 系统落地指南" source_url: "https://mp.weixin.qq.com/s/a10NnBuBDmaStoDZjOhzjA" original_title: "万字长文 | Agent Harness 架构设计与实现:生产级 Agent 系统落地指南" author: ["架构师的野望"] publication: "架构师的野望" published_date: 2026-05-08 created: 2026-05-15 updated: 2026-05-15 type: raw tags: [agent, harness, architecture, production, context-engineering, memory-system, tool-system, multi-agent, llm] review_value: 9 review_confidence: 8 review_score: 72 review_stars: 5 review_recommendation: "入库" sha256: a10NnBuBDmaStoDZjOhzjA source: wechat --- # Agent Harness 架构设计与实现 ## 7 层金字塔架构 | 层级 | 名称 | 核心问题 | |------|------|---------| | L1 | 核心执行引擎 | 双循环、多模型、稳定性 | | L2 | 工具系统 | 标准定义、权限、沙箱、MCP 生态 | | L3 | 上下文工程 | 隔离、压缩、成本优化 | | L4 | 记忆系统 | 短期/中期/长期记忆、低幻觉 RAG | | L5 | 自主决策引擎 | 目标管理、自主规划、自学习 | | L6 | 多 Agent 协作 | 任务分配、共识、冲突解决 | | L7 | 垂直行业应用 | 医疗、法律、金融、研发 | ## 核心执行引擎 **双循环**:快执行循环(小脑,快速)+ 慢思考循环(每3步或出错触发,全局复盘)。效果:任务成功率 60%→90%+。 **断点续跑**:每步状态持久化,崩溃/重启后从断点继续。 **多模型抽象层**:统一接口,成本降 50%+,5 个提供商,20+ 路由规则。 ## 工具系统 **五级风险分级**:L0 只读自动执行 → L1 新文件写入 → L2 Diff预览 → L3 人工审批 → L4 直接拦截。 **路径安全**:getCanonicalFile() 防跳出工作目录。 **MCP 生态**:Agent 世界 USB 标准,80% 工具来自社区 MCP。 ## 上下文工程 **阶梯压缩**:按分数分级(L0 保留 → L3 以下删除)。Token 消耗降 52%。 **会话隔离**:独立生命周期,LRU 淘汰,租户完全隔离。 ## 记忆系统 **三层记忆**:L1 短期(内存)+ L2 中期(本地 DB)+ L3 长期(向量库)。 **知识编译**:QA 对知识单元,幻觉率 30%→5% 以下,准确率 95%+。