PilotDeck

面向任务制的 AI Agent 生产力平台 —— 以 WorkSpace 为单位,重新定义智能体的操作边界与记忆演化。

官方网站 在线体验 License MCP Native Stars
Discord   飞书群   微信群

English | 简体中文
官网 · 在线体验 · 教程 · 快速开始 · 核心亮点 · 使用场景 · 社区

--- **更新日志** 🔥 - **[2026.05.28]** PilotDeck 正式开源!欢迎访问官网 [pilotdeck.openbmb.cn](https://pilotdeck.openbmb.cn),期待社区的贡献、反馈与 Star 支持。 --- ## 💡 关于 PilotDeck **PilotDeck** 是一个以「WorkSpace(工作舱)」为核心设计的开源智能体操作系统,由清华大学 [THUNLP](https://nlp.csai.tsinghua.edu.cn/) 实验室、[面壁智能](https://modelbest.cn/)、[OpenBMB](https://www.openbmb.cn/) 与 [AI9Stars](https://github.com/AI9Stars) 联合研发并开源,面向通用场景、适用于多任务,是 Agent 时代一个真正的「生产力工具」。 当前 AI Agent Harness 领域已涌现出一批优秀的代表成果,各有侧重:**Claude Code / Cursor / Trae Solo** 把模型的推理能力深度集成进了编程 IDE;**Claude Cowork** 引入了项目隔离的概念,把 Agent 带到了桌面端的知识工作场景;**WorkBuddy** 打通了 IM 生态,让 AI 在企微 / 飞书等通讯工具中触手可及。 然而,当我们把视角从"单次编程"或"即时问答"切换到**长周期、多项目并行的生产力创作**时,仍有一些尚未被很好回答的问题: - 多项目并行时,记忆能否做到 **白盒可追溯**?AI 记错了,能否定位到哪条记忆出错、直接修改,而不必重开会话? - Token 成本能否 **按任务分项追踪**?让后台常驻推进变得经济可行? - 不同难度的任务,能否 **自动匹配不同模型**?而不是简单任务也跑最贵的旗舰模型? - 人离开电脑后,活能否继续推进?Agent 能否 **主动发现值得做的事、汇报进展、把成果落地为文件**? PilotDeck 正是围绕这些问题做的增量探索。它以 WorkSpace 为基本单位,将文件、记忆、技能在项目级别完整隔离与沉淀,并配套提供 **白盒记忆**、**智能路由**、**Always-on** 三大能力,整套系统原生支持 [Model Context Protocol (MCP)](https://modelcontextprotocol.io/),跨前端(Web / CLI / IM)行为一致。 ### ✨ 核心亮点
**WorkSpace 级隔离与沉淀** 每个项目拥有独立的专属文件系统、记忆库与技能集。多任务并行互不干扰,检索空间有边界,技能随任务自动沉淀,告别全局上下文污染。

WorkSpace 级隔离与沉淀演示

**可追溯的白盒记忆** 记忆的生成、抽取、存储与使用全链路可见。AI 记错时可直接定位并手动修改。内置 **Dream 模式**,利用空闲时间自动归纳整理,并支持一键回滚。

白盒记忆演示

**智能路由与成本优化** 内置任务难度识别,复杂任务调用强力模型(如 Claude 3.5 Sonnet / GPT-4o),简单任务降级至轻量模型。通过端云协同与精准匹配,大幅降低 Token 消耗。

智能路由演示

**Always-on 常驻执行** 突破"你问我答"的限制。用户离开后,Agent 仍能在后台主动发现潜在任务、执行长周期监控、并最终将成果落地为本地文件与摘要汇报。

Always-on 常驻执行演示

### 📊 核心能力实测数据 PilotDeck 的三大核心能力在实际生产环境中展现出了显著的优势: #### 1. 智能路由:社媒场景节省 ~70% 成本 在小红书等社媒运营场景中,开启智能路由后,系统会自动将简单的文本润色、排版任务降级给子 Agent(如 Sonnet 4.5),仅在核心规划节点使用 Opus 4.5,实测成本大幅下降:
方案 模型编排 费用 倍率
开启省钱路由 主 Opus 4.5 + 子 Sonnet 4.5 $2.83 1.1×
不开省钱路由 全 Opus 4.5(主 + 子) $12.58 5.0×
单体大模型 单体 Opus 4.5 长 react(预估) $12.20 4.8×
#### 2. 智能路由:复杂任务 1/6 成本超越顶级模型 研究团队在播客多语言推送、多源数据报告、领域论文综述、代码库架构文档等 7 个复杂任务上进行了对比测试。结果表明,采用"主强子弱"的路由编排,能以极低的成本达到最优效果:
配置 得分 成本
MiniMax-M2.7 单 Agent 37.1 $1.90
Claude Sonnet 4.6 单 Agent 69.1 $18.36
主 Sonnet 4.6 + 子 MiniMax-M2.7 70.6 $3.15
#### 3. 白盒记忆:排版与文风不再"串台" 在传统的黑盒 Agent 中,多任务混居会导致记忆全局污染。PilotDeck 通过 WorkSpace 实现了记忆的白盒化管理:
维度 现有 AI Agent(黑盒) PilotDeck(白盒)
可见性 看不到 AI 记住了什么,只能看到最终输出 随时查看记住了哪些内容、何时记录、属于哪个 WorkSpace
可控性 写入后无法修改、删除,只能等 AI 自己"想明白" 手动改 / 删 / 标记关键节点,重要决策不丢失
可追溯 出错时无法定位根本原因 生成 → 抽取 → 存储 → 使用,每个环节可查可改
隔离性 共享一个记忆池,跨项目互相污染 按 WorkSpace 隔离,A 项目的记忆不会跑到 B 项目
可回滚 上下文压缩后无法查看原始内容 Dream 整理后支持一键回滚到整理前状态,不怕"越整理越乱"
--- ## 🖥️ 交互界面与演示 PilotDeck 提供了开箱即用的 Web UI,支持完整的 WorkSpace 管理、白盒记忆编辑、以及多智能体协作过程的可视化。 ### 使用场景 > 以下所有演示均由端侧模型通过 PilotDeck 智能路由完成生成——无需调用云端大模型。 #### 工作文档生成 > *"调研一下中国大模型应用市场,整理成一份正式的 HTML 白皮书"*
执行过程 最终成果
#### 小游戏开发 > *"用 Vibe Coding 模式陪我做一款 iOS AR 小游戏《找球球》"*
执行过程 最终成果
#### AI 工程平台开发 > *"从零造一个 Embedding 低代码调优平台"*
执行过程 最终成果
#### 音视频剪辑&自媒体运营 > *"把这期英文播客推送给中日法韩西阿六语全球受众"*
执行过程 最终成果(含音频)
https://github.com/user-attachments/assets/a7245467-ee3c-4939-a055-c56576ac56d1
--- ## 📦 安装与快速开始 我们提供了 macOS/Linux 下的一键安装脚本,以及适合开发者的源码启动方式。 ### 方式一:一键安装 (推荐, macOS/Linux) ```bash curl -fsSL https://raw.githubusercontent.com/OpenBMB/PilotDeck/main/install.sh | bash ``` 该脚本将自动配置 Node.js 22 环境、克隆代码、安装依赖并编译前端。安装完成后,直接运行: ```bash pilotdeck # 在 http://localhost:3001 启动服务 pilotdeck status # 查看运行状态 ``` ### 方式二:源码启动 (适合开发者) **1. 克隆代码与安装依赖** > 本仓库使用 [Git LFS](https://git-lfs.com/) 管理大型媒体文件。克隆前请确保已安装 `git lfs`。 > 如果不需要演示视频/GIF,可在 clone 前加上 `GIT_LFS_SKIP_SMUDGE=1` 跳过下载。 ```bash git clone https://github.com/OpenBMB/PilotDeck.git cd PilotDeck npm install # 安装根目录依赖 (Gateway 运行时) cd ui && npm install # 安装 UI 依赖 cd .. ``` **2. 配置模型 Provider** PilotDeck 依赖 `~/.pilotdeck/pilotdeck.yaml` 进行配置。您可以手动创建、运行启动脚本自动生成,**或者在启动 Web UI 后直接在设置界面中进行可视化配置**。 支持 OpenAI、Anthropic、DeepSeek、Qwen、Kimi、MiniMax 等多种协议。 ```yaml schemaVersion: 1 agent: model: deepseek/deepseek-v4-pro model: providers: deepseek: protocol: openai url: https://api.deepseek.com/v1 apiKey: sk-your-api-key ``` **3. 启动服务** ```bash cd ui && npm run dev # 开发模式 (HMR),访问 http://localhost:5173 # 或 cd ui && npm run start # 生产模式,访问 http://localhost:3001 ``` ### 方式三:Docker Compose 如果您已安装 Docker,也可以直接使用容器方式启动: ```bash docker compose up -d ``` --- ## 🛠️ 扩展与插件 (Extension Protocol) PilotDeck 采用开放的插件架构,插件代码与开源核心严格隔离。开发者可以通过 `plugin.json` 轻松扩展系统能力: - **MCP Servers**: 原生支持集成 Model Context Protocol 服务器。 - **Tools & Skills**: 注册自定义工具,或通过 [ClawHub](https://www.npmjs.com/package/clawhub) 引入社区 Skill。 - **Lifecycle Hooks**: 拦截 `PreToolUse`、`UserPromptSubmit` 等关键生命周期。 - **Custom Memory**: 允许接入自定义的记忆存储 Provider。 --- ## 🤝 参与贡献 感谢所有为 PilotDeck 提交代码与反馈的开发者!我们欢迎新的成员加入,共同构建下一代智能体操作系统。 贡献流程:**Fork 本仓库 → 创建 Feature 分支 → 提交 PR**。 --- ## 💬 联系我们 - 关于技术问题及功能请求,请提交 [GitHub Issues](https://github.com/OpenBMB/PilotDeck/issues)。 - 欢迎加入我们的社区与我们交流:
微信交流群 飞书交流群 Discord 社区
微信二维码 飞书二维码 Discord 二维码
--- ## 🙏 致谢 感谢 OpenClaw、Claude Code、Codex、Cursor、Hermes 等 Agent OS 先行者的探索,为这一领域的发展提供了重要启发。 PilotDeck 的建设离不开以下优秀开源项目的支持: - [ClawXRouter](https://github.com/OpenBMB/ClawXRouter) — 智能模型路由 - [ClawXMemory](https://github.com/OpenBMB/ClawXMemory) — Agent 记忆系统 - [Claude Code UI](https://github.com/siteboon/claudecodeui) — Web UI 参考 - [Claude Code Router](https://github.com/musistudio/claude-code-router) — 模型路由参考 - [UltraRAG](https://github.com/OpenBMB/UltraRAG) — RAG 框架 - [Anthropic Skills](https://github.com/anthropics/skills) — Agent 技能框架和内置技能(skill-creator) - [Vercel Labs Skills](https://github.com/vercel-labs/skills) — find-skills 技能 - [MiniMax-AI Skills](https://github.com/MiniMax-AI/skills) — minimax-pdf 技能 - [frontend-slides](https://github.com/zarazhangrui/frontend-slides) — 用编程 Agent 的前端能力创建精美网页幻灯片 - [Karpathy Guidelines](https://x.com/karpathy/status/2015883857489522876) — LLM 编码行为准则 - [Vite](https://github.com/vitejs/vite) — 前端构建工具 - [React](https://github.com/facebook/react) — UI 框架 - [Tailwind CSS](https://github.com/tailwindlabs/tailwindcss) — 原子化 CSS 框架 - [shadcn/ui](https://github.com/shadcn-ui/ui) — 可访问的 React 组件原语 --- ## 🏢 联合研发

PilotDeck 由清华大学 THUNLP面壁智能OpenBMBAI9Stars 联合研发。

--- ## ⭐ 支持我们 如果您觉得 PilotDeck 对您的工作或研究有帮助,请点亮一颗 Star 支持我们! --- ## 📝 引用 ```bibtex @misc{pilotdeck2026, author = {PilotDeck Team}, title = {PilotDeck: A WorkSpace-Centric Open-Source Agent Operating System}, howpublished = {\url{https://github.com/OpenBMB/PilotDeck}}, year = {2026}, note = {Accessed: 2026-05-29} } ``` ## 📄 许可证 本项目基于 [GNU Affero General Public License v3.0](LICENSE) 开源。