---
source_url: "https://mp.weixin.qq.com/s/TdfsW6iCBmy3esAQ78LkyQ"
ingested: 2026-06-26
sha256: 929e79a1ea32c0c2
---
sha256: 09cf4dcdb8c6bf42
---
title: "小龙虾彻底凉了？清华团队连夜开源Agent神器PilotDeck，Token成本狂降70%！"
source: wechat
source_url: https://mp.weixin.qq.com/s/TdfsW6iCBmy3esAQ78LkyQ
author: ASI启示录
feed_name: 新智元
review_value: 8
review_confidence: 8
review_recommendation: strong
review_stars: 4
date: 2026-05-28
created: 2026-05-28
updated: 2026-05-28
tags: [pilotdeck, agent-os, openbmb, thunlp, tsinghua, workspace, memory-management, token-routing, cost-optimization, agent-architecture, open-source]
type: article
provenance_state: synthesized
sha256: 5a2daaf93a5fc9f78d3aa0418b335fcdecdd3893e987789937f5c25902b81af6
---

# 小龙虾彻底凉了？清华团队连夜开源Agent神器PilotDeck，Token成本狂降70%！

> **来源**：新智元，2026年5月28日
> **背景**：清华大学THUNLP实验室、面壁智能、OpenBMB、AI9stars 联合开源 PilotDeck——AI Agent 操作系统，主打独立工作舱、白盒记忆、智能路由

## 一句话

清华系团队开源 PilotDeck：一个 AI Agent 操作系统，包含独立 WorkSpace（AI 完整生存环境）、白盒可控记忆（逐条可改可删）、子Agent级智能路由（Token成本降低70%），完全开源。

## 为什么"小龙虾凉了"

OpenClaw 2026年初以史上最快速度在GitHub爆火，但它跑得太快，没来得及建立足够深的代码壁垒和生态。PilotDeck 作为"清华系高材生"，面向纯粹生产力，要把小龙虾拍在沙滩上。

## 核心架构

### 独立 WorkSpace

每个 WorkSpace 是 AI 的完整生存环境。多个 WorkSpace 可以同时运行，独立执行不同任务（如一个做游戏、一个做数据可视化），互不干扰。

### 白盒化记忆系统

**问题**：AI 记住了什么、什么时候记的、记对了没有，依然不够清晰。

**PilotDeck 的答案**：
- 打开 Memory 面板，每条记忆标着**时间戳、来源路径和类型**
- **Project Memory**：记项目核心定义
- **Collaboration Feedback**：记你的交付偏好
- **记错了 → 点进去改；记忆冲突 → 直接删**
- 不需要重启对话，不需要重新喂一遍偏好

**Dream 机制**：空闲时段，AI 在后台自动回顾整理自己的记忆（白天干活、晚上消化）。Memory 面板上有 "Memory Dream" 按钮和 "Rollback Last Dream" 按钮——Dream 整理出错了还能一键回滚。

**效果**：AI 越用越"听话"，偏好沉淀在 Feedback Memory 里，看得见、调得了。

## 智能路由：Token成本降低70%

### 问题

Agent 工具有个公开的秘密：用起来很爽，账单一出却很吓人。全程调最强模型跑任务，Token 烧起来比打车还贵。

### PilotDeck 的做法：子Agent级路由

**大部分路由方案**是按 request 级别切的——每次请求单独判断走哪个模型，模型频繁切换打断 KV-cache，相当于每次换模型都要重新"读档"，推理效率反而下降。

**PilotDeck 的路由是在子Agent层面做的**：一个复杂任务拆成多个子任务后，整个子Agent 分配给一个模型跑到底，子Agent 内部的上下文缓存是连续的。省的不只是 token 的钱，还有来回切换带来的性能损耗。

### 调度规则

- 支持用规则和 prompt 调节路由策略
- 可以自己定义什么类型的任务走什么模型
- 用自然语言告诉它"代码相关的子任务都走 Claude Opus，文本处理走便宜模型"

### 效果数据

| 任务 | 不开路由 | 开路由 | 节省 |
|------|----------|--------|------|
| 程序员人格测试 | $10.97 | $1.42 | **75%** |
| 小红书内容生成 | $12.58 | $2.83 | **约70%** |
| 播客多语言+金融分析+代码文档 | $18.36 (Sonnet 4.6) | $3.15 (主Sonnet 4.6+子MiniMax-M2.7) | **约83%**，效果略好 |

### 路由不止于省钱

- 可以接**本地部署的模型**做子Agent，敏感数据不出本机
- 有些任务会自动判断需要什么工具，自动部署端侧模型（如 VoxCPM 生成语音）
- 云端模型负责思考，本地模型负责执行——省钱和隐私一起解决

## 核心价值

| 痛点 | 解决方案 |
|------|----------|
| 成本 | 子Agent级智能路由，降低70% token消耗 |
| 隔离 | 独立WorkSpace，多任务并行互不干扰 |
| 记忆黑盒 | 白盒化记忆，逐条可改可删，带Dream自动整理和回滚 |
| 隐私 | 支持本地模型，敏感数据不出本机 |

## 开源

- GitHub: https://github.com/OpenBMB/PilotDeck
- 官网: https://pilotdeck.openbmb.cn/

## 一句话总结

清华系 PilotDeck 击穿了 Agent 落地的三个硬核工程痛点：成本（子Agent级路由降70%）、隔离（独立WorkSpace）、记忆黑盒（白盒化可控记忆+Dream机制）。

---

*清华大学THUNLP实验室 / 面壁智能 / OpenBMB / AI9stars*