面向任务制的 AI Agent 生产力平台 —— 以 WorkSpace 为单位，重新定义智能体的操作边界与记忆演化。

English | 简体中文
官网 · 在线体验 · 教程 · 快速开始 · 核心亮点 · 使用场景 · 社区

--- **更新日志** 🔥 - **[2026.05.28]** PilotDeck 正式开源！欢迎访问官网 [pilotdeck.openbmb.cn](https://pilotdeck.openbmb.cn)，期待社区的贡献、反馈与 Star 支持。 --- ## 💡 关于 PilotDeck **PilotDeck** 是一个以「WorkSpace（工作舱）」为核心设计的开源智能体操作系统，由清华大学 [THUNLP](https://nlp.csai.tsinghua.edu.cn/) 实验室、[面壁智能](https://modelbest.cn/)、[OpenBMB](https://www.openbmb.cn/) 与 [AI9Stars](https://github.com/AI9Stars) 联合研发并开源，面向通用场景、适用于多任务，是 Agent 时代一个真正的「生产力工具」。当前 AI Agent Harness 领域已涌现出一批优秀的代表成果，各有侧重：**Claude Code / Cursor / Trae Solo** 把模型的推理能力深度集成进了编程 IDE；**Claude Cowork** 引入了项目隔离的概念，把 Agent 带到了桌面端的知识工作场景；**WorkBuddy** 打通了 IM 生态，让 AI 在企微 / 飞书等通讯工具中触手可及。然而，当我们把视角从"单次编程"或"即时问答"切换到**长周期、多项目并行的生产力创作**时，仍有一些尚未被很好回答的问题： - 多项目并行时，记忆能否做到 **白盒可追溯**？AI 记错了，能否定位到哪条记忆出错、直接修改，而不必重开会话？ - Token 成本能否 **按任务分项追踪**？让后台常驻推进变得经济可行？ - 不同难度的任务，能否 **自动匹配不同模型**？而不是简单任务也跑最贵的旗舰模型？ - 人离开电脑后，活能否继续推进？Agent 能否 **主动发现值得做的事、汇报进展、把成果落地为文件**？ PilotDeck 正是围绕这些问题做的增量探索。它以 WorkSpace 为基本单位，将文件、记忆、技能在项目级别完整隔离与沉淀，并配套提供 **白盒记忆**、**智能路由**、**Always-on** 三大能力，整套系统原生支持 [Model Context Protocol (MCP)](https://modelcontextprotocol.io/)，跨前端（Web / CLI / IM）行为一致。 ### ✨ 核心亮点

WorkSpace 级隔离与沉淀每个项目拥有独立的专属文件系统、记忆库与技能集。多任务并行互不干扰，检索空间有边界，技能随任务自动沉淀，告别全局上下文污染。	可追溯的白盒记忆记忆的生成、抽取、存储与使用全链路可见。AI 记错时可直接定位并手动修改。内置 Dream 模式，利用空闲时间自动归纳整理，并支持一键回滚。
智能路由与成本优化内置任务难度识别，复杂任务调用强力模型（如 Claude 3.5 Sonnet / GPT-4o），简单任务降级至轻量模型。通过端云协同与精准匹配，大幅降低 Token 消耗。	Always-on 常驻执行突破"你问我答"的限制。用户离开后，Agent 仍能在后台主动发现潜在任务、执行长周期监控、并最终将成果落地为本地文件与摘要汇报。

### 📊 核心能力实测数据 PilotDeck 的三大核心能力在实际生产环境中展现出了显著的优势： #### 1. 智能路由：社媒场景节省～70% 成本在小红书等社媒运营场景中，开启智能路由后，系统会自动将简单的文本润色、排版任务降级给子 Agent（如 Sonnet 4.5），仅在核心规划节点使用 Opus 4.5，实测成本大幅下降：

方案	模型编排	费用	倍率
开启省钱路由	主 Opus 4.5 + 子 Sonnet 4.5	$2.83	1.1×
不开省钱路由	全 Opus 4.5（主 + 子）	$12.58	5.0×
单体大模型	单体 Opus 4.5 长 react（预估）	$12.20	4.8×

#### 2. 智能路由：复杂任务 1/6 成本超越顶级模型研究团队在播客多语言推送、多源数据报告、领域论文综述、代码库架构文档等 7 个复杂任务上进行了对比测试。结果表明，采用"主强子弱"的路由编排，能以极低的成本达到最优效果：

配置	得分	成本
MiniMax-M2.7 单 Agent	37.1	$1.90
Claude Sonnet 4.6 单 Agent	69.1	$18.36
主 Sonnet 4.6 + 子 MiniMax-M2.7	70.6	$3.15

#### 3. 白盒记忆：排版与文风不再"串台" 在传统的黑盒 Agent 中，多任务混居会导致记忆全局污染。PilotDeck 通过 WorkSpace 实现了记忆的白盒化管理：

维度	现有 AI Agent（黑盒）	PilotDeck（白盒）
可见性	看不到 AI 记住了什么，只能看到最终输出	随时查看记住了哪些内容、何时记录、属于哪个 WorkSpace
可控性	写入后无法修改、删除，只能等 AI 自己"想明白"	手动改 / 删 / 标记关键节点，重要决策不丢失
可追溯	出错时无法定位根本原因	生成 → 抽取 → 存储 → 使用，每个环节可查可改
隔离性	共享一个记忆池，跨项目互相污染	按 WorkSpace 隔离，A 项目的记忆不会跑到 B 项目
可回滚	上下文压缩后无法查看原始内容	Dream 整理后支持一键回滚到整理前状态，不怕"越整理越乱"

--- ## 🖥️ 交互界面与演示 PilotDeck 提供了开箱即用的 Web UI，支持完整的 WorkSpace 管理、白盒记忆编辑、以及多智能体协作过程的可视化。 ### 使用场景 > 以下所有演示均由端侧模型通过 PilotDeck 智能路由完成生成——无需调用云端大模型。 #### 工作文档生成 > *"调研一下中国大模型应用市场，整理成一份正式的 HTML 白皮书"*

执行过程	最终成果

#### 小游戏开发 > *"用 Vibe Coding 模式陪我做一款 iOS AR 小游戏《找球球》"*

执行过程	最终成果

#### AI 工程平台开发 > *"从零造一个 Embedding 低代码调优平台"*

执行过程	最终成果

#### 音视频剪辑&自媒体运营 > *"把这期英文播客推送给中日法韩西阿六语全球受众"*

执行过程	最终成果（含音频）
	https://github.com/user-attachments/assets/a7245467-ee3c-4939-a055-c56576ac56d1

--- ## 📦 安装与快速开始我们提供了 macOS/Linux 下的一键安装脚本，以及适合开发者的源码启动方式。 ### 方式一：一键安装 (推荐, macOS/Linux) ```bash curl -fsSL https://raw.githubusercontent.com/OpenBMB/PilotDeck/main/install.sh | bash ``` 该脚本将自动配置 Node.js 22 环境、克隆代码、安装依赖并编译前端。安装完成后，直接运行： ```bash pilotdeck # 在 http://localhost:3001 启动服务 pilotdeck status # 查看运行状态 ``` ### 方式二：源码启动 (适合开发者) **1. 克隆代码与安装依赖** > 本仓库使用 [Git LFS](https://git-lfs.com/) 管理大型媒体文件。克隆前请确保已安装 `git lfs`。 > 如果不需要演示视频/GIF，可在 clone 前加上 `GIT_LFS_SKIP_SMUDGE=1` 跳过下载。 ```bash git clone https://github.com/OpenBMB/PilotDeck.git cd PilotDeck npm install # 安装根目录依赖 (Gateway 运行时) cd ui && npm install # 安装 UI 依赖 cd .. ``` **2. 配置模型 Provider** PilotDeck 依赖 `~/.pilotdeck/pilotdeck.yaml` 进行配置。您可以手动创建、运行启动脚本自动生成，**或者在启动 Web UI 后直接在设置界面中进行可视化配置**。支持 OpenAI、Anthropic、DeepSeek、Qwen、Kimi、MiniMax 等多种协议。 ```yaml schemaVersion: 1 agent: model: deepseek/deepseek-v4-pro model: providers: deepseek: protocol: openai url: https://api.deepseek.com/v1 apiKey: sk-your-api-key ``` **3. 启动服务** ```bash cd ui && npm run dev # 开发模式 (HMR)，访问 http://localhost:5173 # 或 cd ui && npm run start # 生产模式，访问 http://localhost:3001 ``` ### 方式三：Docker Compose 如果您已安装 Docker，也可以直接使用容器方式启动： ```bash docker compose up -d ``` --- ## 🛠️ 扩展与插件 (Extension Protocol) PilotDeck 采用开放的插件架构，插件代码与开源核心严格隔离。开发者可以通过 `plugin.json` 轻松扩展系统能力： - **MCP Servers**: 原生支持集成 Model Context Protocol 服务器。 - **Tools & Skills**: 注册自定义工具，或通过 [ClawHub](https://www.npmjs.com/package/clawhub) 引入社区 Skill。 - **Lifecycle Hooks**: 拦截 `PreToolUse`、`UserPromptSubmit` 等关键生命周期。 - **Custom Memory**: 允许接入自定义的记忆存储 Provider。 --- ## 🤝 参与贡献感谢所有为 PilotDeck 提交代码与反馈的开发者！我们欢迎新的成员加入，共同构建下一代智能体操作系统。贡献流程：**Fork 本仓库 → 创建 Feature 分支 → 提交 PR**。 --- ## 💬 联系我们 - 关于技术问题及功能请求，请提交 [GitHub Issues](https://github.com/OpenBMB/PilotDeck/issues)。 - 欢迎加入我们的社区与我们交流：

微信交流群	飞书交流群	Discord 社区

--- ## 🙏 致谢感谢 OpenClaw、Claude Code、Codex、Cursor、Hermes 等 Agent OS 先行者的探索，为这一领域的发展提供了重要启发。 PilotDeck 的建设离不开以下优秀开源项目的支持： - [ClawXRouter](https://github.com/OpenBMB/ClawXRouter) — 智能模型路由 - [ClawXMemory](https://github.com/OpenBMB/ClawXMemory) — Agent 记忆系统 - [Claude Code UI](https://github.com/siteboon/claudecodeui) — Web UI 参考 - [Claude Code Router](https://github.com/musistudio/claude-code-router) — 模型路由参考 - [UltraRAG](https://github.com/OpenBMB/UltraRAG) — RAG 框架 - [Anthropic Skills](https://github.com/anthropics/skills) — Agent 技能框架和内置技能（skill-creator） - [Vercel Labs Skills](https://github.com/vercel-labs/skills) — find-skills 技能 - [MiniMax-AI Skills](https://github.com/MiniMax-AI/skills) — minimax-pdf 技能 - [frontend-slides](https://github.com/zarazhangrui/frontend-slides) — 用编程 Agent 的前端能力创建精美网页幻灯片 - [Karpathy Guidelines](https://x.com/karpathy/status/2015883857489522876) — LLM 编码行为准则 - [Vite](https://github.com/vitejs/vite) — 前端构建工具 - [React](https://github.com/facebook/react) — UI 框架 - [Tailwind CSS](https://github.com/tailwindlabs/tailwindcss) — 原子化 CSS 框架 - [shadcn/ui](https://github.com/shadcn-ui/ui) — 可访问的 React 组件原语 --- ## 🏢 联合研发

PilotDeck 由清华大学 THUNLP、面壁智能、OpenBMB 与 AI9Stars 联合研发。

--- ## ⭐ 支持我们如果您觉得 PilotDeck 对您的工作或研究有帮助，请点亮一颗 Star 支持我们！ --- ## 📝 引用 ```bibtex @misc{pilotdeck2026, author = {PilotDeck Team}, title = {PilotDeck: A WorkSpace-Centric Open-Source Agent Operating System}, howpublished = {\url{https://github.com/OpenBMB/PilotDeck}}, year = {2026}, note = {Accessed: 2026-05-29} } ``` ## 📄 许可证本项目基于 [GNU Affero General Public License v3.0](LICENSE) 开源。

WorkSpace 级隔离与沉淀每个项目拥有独立的专属文件系统、记忆库与技能集。多任务并行互不干扰，检索空间有边界，技能随任务自动沉淀，告别全局上下文污染。	可追溯的白盒记忆记忆的生成、抽取、存储与使用全链路可见。AI 记错时可直接定位并手动修改。内置 Dream 模式，利用空闲时间自动归纳整理，并支持一键回滚。
智能路由与成本优化内置任务难度识别，复杂任务调用强力模型（如 Claude 3.5 Sonnet / GPT-4o），简单任务降级至轻量模型。通过端云协同与精准匹配，大幅降低 Token 消耗。	Always-on 常驻执行突破"你问我答"的限制。用户离开后，Agent 仍能在后台主动发现潜在任务、执行长周期监控、并最终将成果落地为本地文件与摘要汇报。