--- source_url: "https://mp.weixin.qq.com/s/TdfsW6iCBmy3esAQ78LkyQ" ingested: 2026-06-26 sha256: 929e79a1ea32c0c2 --- sha256: 09cf4dcdb8c6bf42 --- title: "小龙虾彻底凉了?清华团队连夜开源Agent神器PilotDeck,Token成本狂降70%!" source: wechat source_url: https://mp.weixin.qq.com/s/TdfsW6iCBmy3esAQ78LkyQ author: ASI启示录 feed_name: 新智元 review_value: 8 review_confidence: 8 review_recommendation: strong review_stars: 4 date: 2026-05-28 created: 2026-05-28 updated: 2026-05-28 tags: [pilotdeck, agent-os, openbmb, thunlp, tsinghua, workspace, memory-management, token-routing, cost-optimization, agent-architecture, open-source] type: article provenance_state: synthesized sha256: 5a2daaf93a5fc9f78d3aa0418b335fcdecdd3893e987789937f5c25902b81af6 --- # 小龙虾彻底凉了?清华团队连夜开源Agent神器PilotDeck,Token成本狂降70%! > **来源**:新智元,2026年5月28日 > **背景**:清华大学THUNLP实验室、面壁智能、OpenBMB、AI9stars 联合开源 PilotDeck——AI Agent 操作系统,主打独立工作舱、白盒记忆、智能路由 ## 一句话 清华系团队开源 PilotDeck:一个 AI Agent 操作系统,包含独立 WorkSpace(AI 完整生存环境)、白盒可控记忆(逐条可改可删)、子Agent级智能路由(Token成本降低70%),完全开源。 ## 为什么"小龙虾凉了" OpenClaw 2026年初以史上最快速度在GitHub爆火,但它跑得太快,没来得及建立足够深的代码壁垒和生态。PilotDeck 作为"清华系高材生",面向纯粹生产力,要把小龙虾拍在沙滩上。 ## 核心架构 ### 独立 WorkSpace 每个 WorkSpace 是 AI 的完整生存环境。多个 WorkSpace 可以同时运行,独立执行不同任务(如一个做游戏、一个做数据可视化),互不干扰。 ### 白盒化记忆系统 **问题**:AI 记住了什么、什么时候记的、记对了没有,依然不够清晰。 **PilotDeck 的答案**: - 打开 Memory 面板,每条记忆标着**时间戳、来源路径和类型** - **Project Memory**:记项目核心定义 - **Collaboration Feedback**:记你的交付偏好 - **记错了 → 点进去改;记忆冲突 → 直接删** - 不需要重启对话,不需要重新喂一遍偏好 **Dream 机制**:空闲时段,AI 在后台自动回顾整理自己的记忆(白天干活、晚上消化)。Memory 面板上有 "Memory Dream" 按钮和 "Rollback Last Dream" 按钮——Dream 整理出错了还能一键回滚。 **效果**:AI 越用越"听话",偏好沉淀在 Feedback Memory 里,看得见、调得了。 ## 智能路由:Token成本降低70% ### 问题 Agent 工具有个公开的秘密:用起来很爽,账单一出却很吓人。全程调最强模型跑任务,Token 烧起来比打车还贵。 ### PilotDeck 的做法:子Agent级路由 **大部分路由方案**是按 request 级别切的——每次请求单独判断走哪个模型,模型频繁切换打断 KV-cache,相当于每次换模型都要重新"读档",推理效率反而下降。 **PilotDeck 的路由是在子Agent层面做的**:一个复杂任务拆成多个子任务后,整个子Agent 分配给一个模型跑到底,子Agent 内部的上下文缓存是连续的。省的不只是 token 的钱,还有来回切换带来的性能损耗。 ### 调度规则 - 支持用规则和 prompt 调节路由策略 - 可以自己定义什么类型的任务走什么模型 - 用自然语言告诉它"代码相关的子任务都走 Claude Opus,文本处理走便宜模型" ### 效果数据 | 任务 | 不开路由 | 开路由 | 节省 | |------|----------|--------|------| | 程序员人格测试 | $10.97 | $1.42 | **75%** | | 小红书内容生成 | $12.58 | $2.83 | **约70%** | | 播客多语言+金融分析+代码文档 | $18.36 (Sonnet 4.6) | $3.15 (主Sonnet 4.6+子MiniMax-M2.7) | **约83%**,效果略好 | ### 路由不止于省钱 - 可以接**本地部署的模型**做子Agent,敏感数据不出本机 - 有些任务会自动判断需要什么工具,自动部署端侧模型(如 VoxCPM 生成语音) - 云端模型负责思考,本地模型负责执行——省钱和隐私一起解决 ## 核心价值 | 痛点 | 解决方案 | |------|----------| | 成本 | 子Agent级智能路由,降低70% token消耗 | | 隔离 | 独立WorkSpace,多任务并行互不干扰 | | 记忆黑盒 | 白盒化记忆,逐条可改可删,带Dream自动整理和回滚 | | 隐私 | 支持本地模型,敏感数据不出本机 | ## 开源 - GitHub: https://github.com/OpenBMB/PilotDeck - 官网: https://pilotdeck.openbmb.cn/ ## 一句话总结 清华系 PilotDeck 击穿了 Agent 落地的三个硬核工程痛点:成本(子Agent级路由降70%)、隔离(独立WorkSpace)、记忆黑盒(白盒化可控记忆+Dream机制)。 --- *清华大学THUNLP实验室 / 面壁智能 / OpenBMB / AI9stars*