[中文](../Flow2Spec基础介绍.md) | [English](./Flow2Spec-Introduction.md) · [项目首页](../../README.zh-CN.md) | [Project home](../../README.md) # Flow2Spec：让项目在开发中自然长出知识图谱

Flow2Spec 封面

--- ## 一、前言

最近一年，很多 AI 编程工具都在解决同一个问题：**让 Agent 记住项目上下文。** 这件事当然重要。但现在只说"项目记忆""上下文管理""规则文件"，已经不够了。因为很多开源项目都在做类似的事：写一个 `AGENTS.md` / `CLAUDE.md`，加一组 rules，建一个 docs 目录，让 Agent 先读项目说明，或者接入向量库做检索。这些方案能缓解问题，但我真正想解决的不是"启动时塞给 AI 一堆上下文"。我想解决的是： **在真实开发过程中，项目知识能不能被持续沉淀、自动路由、持续验证，并且随着代码一起演进。** 这就是 Flow2Spec。一句话介绍：**Flow2Spec 是一个让项目在开发过程中自然长出知识图谱的 Agent 工程框架。** --- ## 二、只做"记忆"为什么不够

只做记忆为什么不够

很多项目接入 AI 后，会很快遇到一个悖论：你希望 AI 多了解项目，但你给它的上下文越多，它越容易读不完、读偏、忘掉重点。于是大家不断加规则：先读这个文件，再读那个目录，这个模块不能改，那个接口有历史兼容，改完记得更新文档……最后上下文变成另一种负担。它看起来像知识库，实际上更像一个不断膨胀的说明书。 Flow2Spec 的判断是：**项目知识不能只靠"写下来"，还要能被路由、被组合、被校验、被持续更新。** --- ## 三、Flow2Spec 的关键差异：开发过程生成知识图谱

开发过程生成知识图谱

Flow2Spec 不是要求你先做一场大规模文档工程。它更推荐的方式是： 1. 先 `flow2spec init` 初始化一个空骨架 2. 用 `f2s-doc-arch` 生成项目架构说明，沉淀进知识库 3. 真实需求来了，Agent 先按现有知识路由 4. 功能实现后，用 `f2s-kb-sync` 把本轮确认的事实同步回知识库 5. 下一次类似需求，再从这份知识中渐进读取 **知识不是一次性建设出来的。它是在需求澄清、技术方案、代码实现、修复问题、知识同步、提交代码的过程中逐步长出来的。** 这也是 Flow2Spec 和普通"项目记忆文件"的区别：普通方案更像给 Agent 一份说明书；Flow2Spec 更像给项目维护一张可演进的知识图谱——落在仓库里的 `.Knowledge/` 中，能 diff、能 review、能随代码提交。 --- ## 四、知识库接口：不是一个大文档，而是一套路由协议

知识库路由协议

Flow2Spec 的知识库有一个明确的接口结构： ```Plain Text .Knowledge/ manifest-routing.json # 机读路由清单 matchers/ # 关键词分片 topics/ # 主题摘要 stock-docs/ # 已落地能力长文档 req-docs/ # 需求 / 技术方案文档 ``` Agent 的读取顺序不是自由发挥，而是按协议走： ```Plain Text manifest-routing.json -> matcher 分片（matcherPath 指向的单个文件） -> match（主候选） -> expand（先依赖 topic，再主 topic；保留次高候选） -> verify（缺口检查） -> 足够：act -> 不足：stock-docs / req-docs（按需） -> 仍不足：源码兜底 -> act 或澄清 ``` 图 1：知识库渐进式读取 ```mermaid flowchart LR subgraph entry["路由入口"] direction LR A["manifest-routing.json
机读路由清单"] --> B["matchers
关键词分片"] end B --> M["match
主候选"] M --> E["expand
先依赖 topic，再主 topic
+ 次高候选"] E --> V{"verify
缺口检查"} V -->|足够| H["act
执行 / 澄清 / 补知识提示"] V -->|不足| F["stock-docs / req-docs
长文档（按需）"] F --> V2{"仍不足?"} V2 -->|是| G["源码兜底"] V2 -->|足够| H G --> H entry ~~~ M ``` 这套结构的价值在于：**知识库对 Agent 暴露的不是"文件"，而是"怎么找到正确知识"的接口。** `manifest-routing.json` 告诉 Agent 有哪些主题；`matchers/*.json` 告诉 Agent 这个需求可能命中哪些主题；`topics/*.md` 给 Agent 短摘要和硬约束；`topicDependencies` 告诉 Agent 哪些前置规则必须一起读；`stock-docs/` 和 `req-docs/` 只在需要时下钻。 --- ## 五、渐进式读取：AI 每次只拿该拿的知识

渐进式读取

Flow2Spec 的读取模型可以概括成四步：**match → expand → verify → act** **match**：Agent 先读 `manifest-routing.json`，再按任务读取对应 matcher 分片。不遍历整个知识库，先缩小候选范围。 **expand**：命中主主题后，通过 `topicDependencies` 继续读取依赖主题，避免只看到局部规则。比如一个功能可能同时依赖公共配置规则、鉴权规则、某个业务模块的约束。 **verify**：命中 topic 不代表知识一定够。Flow2Spec 要求 Agent 在执行前检查：当前主题是否真的覆盖用户问题，是否缺关键依赖，是否需要读长文档，是否需要先反问用户。这一步把"看起来命中了"变成"确认可以执行"。 **act**：只有在知识覆盖足够、边界清楚时，Agent 才进入实现、修改或提交。如果置信度不足，就先澄清，而不是硬改。 --- ## 六、多依赖能力：不让 Agent 只读到一半规则

多依赖能力

真实项目里，很多错误不是因为 AI 完全没读知识，而是它只读了一个局部知识，漏掉了前置约束： - 改功能时读了业务 topic，但没读提交规则 - 生成技术方案时读了需求文档，但没读 req\-docs / stock\-docs 的边界规则 - 修改配置时读了模块说明，但没读配置开关默认值 Flow2Spec 把这些依赖显式放进路由层。一个 topic 可以声明它依赖哪些 topic，Agent 命中主主题时会先展开依赖。这不是简单的"多读几个文件"，而是把项目知识从扁平文档变成有边的图： ```Plain Text 需求实现 -> 文档路由规则 -> 技术方案规则 -> 任务追踪规则 -> Git 提交规则 ``` 这让 Agent 每次读取的不是孤立片段，而是一组经过声明的上下文组合。 --- ## 七、知识库正确性：不是写了 topic 就算完

知识库正确性

知识库最怕两件事：过期和写错。Flow2Spec 没有假设知识库永远正确，它把"验证"放进了开发流程。典型场景：用户问一个业务细节，Agent 先查知识库，发现 topic 有覆盖但不够细，继续读源码得到更准确的事实。这时 Flow2Spec 不应该只回答完就结束，还要判断： - 这个事实是否已经写进 topic - 如果没写或不够细，是否应该提示用 `f2s-kb-distill` 把本轮问答提取入库 - 如果知识看起来已覆盖，是否能证明覆盖来源；不能证明就不能静默这就是"知识库补充建议收口"。**它让 AI 从源码里找到的每次新知识，都不只留在本次聊天里，而是反哺回知识库。** --- ## 八、用户意图识别：不是所有话都应该自动进流程

用户意图识别

用户说一句话，Agent 到底应该回答、讨论、澄清，还是直接进开发流程？ - "这个方案可行吗？" → 应该是讨论，不应该自动开始写代码 - "修一下这个 bug" → 应该进入 fix 流程 - "我想做一个新能力，先帮我把需求问清楚" → 应该进入需求澄清，而不是直接实现 Flow2Spec 里有 `intentRecognition` 开关，开启后 Agent 会按意图识别规则做辅助判断：高置信新增能力进入 feat 流程，高置信修复问题进入 fix 流程，需求不清楚进入 req\-clarify，只是询问/讨论则保持普通对话。经过一段时间真实项目验证，**意图识别已经比较稳定，建议默认开启**，让 Agent 在大多数场景下自动分流；当然你也可以随时显式输入 `f2s-req-clarify`、`f2s-kb-feat`、`f2s-kb-fix` 等命令，覆盖自动判断结果。建议多显式使用 f2s\-\* skill**，熟悉这些技能的用法，可以更高效地使用 Flow2Spec。 --- ## 九、一个更真实的开发闭环

开发闭环

使用 Flow2Spec 后，一个需求可能是这样流动的： ```Plain Text 用户提出需求 -> 显式 f2s-* skill / intentRecognition 辅助判断 -> f2s-req-clarify 反问到无歧义 -> f2s-req-tech 生成技术方案 -> Agent 按知识库渐进读取 -> 实现代码 -> changeTracking 记录任务进度 -> f2s-kb-sync 同步新知识 -> f2s-git-commit 提交前检查 ``` 图 2：开发过程生成知识图谱 ```mermaid flowchart TD A[用户提出需求] --> B{显式 f2s-* skill
或 intentRecognition 辅助判断} B -->|需求不清| C[f2s-req-clarify
需求澄清] B -->|新增能力| D[f2s-kb-feat
新增能力] B -->|修复问题| E[f2s-kb-fix
修复问题] B -->|大需求 / 需方案| F[f2s-req-tech
技术方案] C --> F D --> G[渐进式读取
match -> expand -> verify -> act] E --> G F --> G G --> H[代码实现 / 修复] H --> I[changeTracking
任务进度落盘] H --> J[f2s-kb-sync
同步已确认事实] J --> K[.Knowledge
知识图谱增量更新] I --> L[f2s-git-commit
提交前检查] K --> L L --> M[下一次类似需求
复用知识] M --> G ``` 这条链路里，每一步都会留下可追踪的资产：需求文档在 `req-docs/`，已落地知识在 `stock-docs/`，主题摘要在 `topics/`，路由关系在 `manifest-routing.json`，任务进度在 `.task/`。 **Flow2Spec 做的不是"让 AI 单次回答更好"，而是在把一次次开发过程转化为项目知识图谱的增量更新。** --- ## 十、它不只管知识，也管开发闭环

开发闭环管理

**任务进度落盘**：开启 `changeTracking` 后，Agent 执行功能开发或方案实现时，会把任务 checklist 写到 `.task/`。新会话继续做时，不需要重新问"上次做到哪"，直接从磁盘任务接上。 **技术方案不硬套模板**：`f2s-req-tech` 会根据当前需求选择合适的技术方案结构，而不是把所有章节机械套一遍，避免前端改造也生成一堆数据库章节。 **多 Agent 编排与校验**：复杂任务可以通过 `subAgent` 拆给子 Agent 处理。如果开启 `switchAgentVerification`，还可以让写入方和验证方分离，降低单个 Agent 自己写、自己验、自己放过的风险。 **提交前知识覆盖检查**：`f2s-git-commit` 会在提交前检查 diff、冲突标记、暂存范围，也会检查本轮变更是否需要同步知识库，让"改代码后忘记更新知识"在提交前能被发现。 **模板与路由升级检测**：Flow2Spec 启动时会检测 `.Knowledge/` 结构版本，如果落后于 npm 包版本，Agent 会提示执行 `f2s-kb-upgrade`，确保项目知识结构与工具版本保持同步。 --- ## 十一、和普通知识库最大的区别

与普通知识库的区别

如果只用一句话概括差异：**普通知识库是给 Agent 查的；Flow2Spec 的知识库是给 Agent 参与维护的。** 图 3：普通记忆文件 vs Flow2Spec 知识图谱 ```mermaid flowchart LR L1["大文档 / rules / docs"] --> L2["Agent 自己翻找"] --> L3["答完即结束"] ``` ```mermaid flowchart LR R5{"缺口验证"} R6["源码兜底"] R7["知识反哺 / 提交检查"] R1["manifest 路由"] R2["matcher 命中"] R3["topic 摘要"] R4["依赖展开"] R5 -->|不足| R6 R6 --> R7 R5 -->|足够| R7 R7 --> R1 --> R2 --> R3 --> R4 R4 --> R5 ``` 普通知识库关注：文档放在哪里、怎么检索、怎么总结。 Flow2Spec 更关注：需求来了该读哪个主题、主题之间有什么依赖、当前知识是否足够执行、源码兜底后是否要反哺、用户意图是否应该触发流程、改代码后知识是否一起更新、提交前是否检查过知识覆盖。这也是为什么 Flow2Spec 会同时包含 `.Knowledge/`、`.task/`、`f2s-*` skills、Agent rules 和 `flow2spec.config.json`——它们不是散件，而是一套围绕开发闭环组织起来的协议。 --- ## 十二、几个常见问题

常见问题

**Q：改动一个能力后，怎么保证对应主题都能更新？** Flow2Spec 不承诺「模型一定自动知道所有影响面」，而是把影响面发现变成一套可执行流程。一次能力改动通常不只对应一个 topic。例如改了「批量重评分」，可能同时影响： | 类型 | 需检查的内容 | | --- | --- | | 业务能力 topic | 这个功能现在怎么工作 | | 配置 topic | 开关、默认值、阈值有没有变化 | | 规则 topic | 幂等、锁、错误码、提交前检查有没有变化 | | 模块 topic | 公共方法、目录边界、调用链有没有变化 | Flow2Spec 通过五层机制提高覆盖率： 1. 路由层：matcher 找主 topic 2. 依赖展开：`topicDependencies` 展开依赖 topic 3. 同步确认：`f2s-kb-sync` 先给出更新大纲，让用户确认 4. 问答收口：普通问答下钻源码后，发现缺口则提示补充 5. 提交门禁：`f2s-git-commit` 提交前做知识覆盖检查 **举例**：改「活动抽奖次数」时，知识更新不应只写「抽奖接口改了」，还可能要同步： - 活动业务 topic：抽奖次数怎么计算 - 数据模型 topic：哪些字段记录已领取 / 剩余次数 - 规则 topic：浏览任务、购买任务、重复领取的限制 - 配置 topic：奖品列表、开关、活动时间 > Flow2Spec 的目标不是让 Agent 凭感觉改一个文件，而是先列出「这次变更可能影响哪些主题」，确认后再落盘。 --- **Q：Flow2Spec 怎么解决 Agent 遗忘规则的问题？** 分两侧看。 **使用侧**：规则不塞进一个大文件，而是拆成可路由、可依赖的结构——入口规则写进各端配置、业务知识放进 `topics`、匹配词放进 `matchers`、依赖关系放进 `topicDependencies`、长文档放进 `stock-docs` / `req-docs`。Agent 每次不靠记忆，而是按 `match → expand → verify → act` 重新取规则。 **设计侧**：五层约束分阶段拦截「规则写了但不遵守」的情况： 1. 入口层：声明读取顺序和禁止项 2. 配置层：执行任何技能前必须先读配置开关 3. 路由层：所有任务先读 manifest，不直接全仓搜索 4. 技能层：每个技能定义前置检查、确认点和收口方式 5. 门禁层：在多个节点分别设门禁——任务归档前检查 checklist、知识落盘前确认大纲、问答下钻源码后强制收口自检、代码提交前检查 diff 与知识覆盖两个典型场景说明这五层如何生效：一是防止意图误判（用户还在澄清阶段，Agent 不能跳去实现）；二是防止源码答完后知识不反哺（必须判断是否需要 `f2s-kb-distill` 把本轮问答提取入库，不允许静默跳过）。 Flow2Spec 的目标不是完全消除遗忘，而是让「绕过规则」在每个阶段都更难发生。 --- **Q：单个主题文件过大怎么办？** topic 的定位是「路由摘要」：记触发词、边界、关键约束和下一步指针，不承载所有细节。长内容放 `stock-docs/`；大功能拆成多个 focused topic，再用 `topicDependencies` 串起来。 **拆分示例**（一万行代码的大功能）： ```text topics/ 活动概览.md 活动任务规则.md 活动数据模型.md 活动外部依赖.md stock-docs/ 活动概述_终稿.md 活动任务规则_终稿.md 活动数据模型_终稿.md 活动外部依赖_终稿.md ``` Agent 先读「活动概览」判断相关性；问任务状态机 → 读「活动任务规则」；问表字段 → 读「活动数据模型」。这样可避免：topic 太大读不完抓不住重点，或触发词太杂导致一个主题什么需求都命中。 --- **Q：如果知识库没有覆盖当前模块怎么办？** Flow2Spec 提供三个互补命令，按触发方式与粒度区分： `f2s-kb-distill` 由 **Agent 自动提示**：在一次问答中下钻源码找到答案后，把本轮问答提取入库；技能内部会按下钻深度与命中主题，自动判新建主题或补充既有主题。 `f2s-kb-add <路径或能力描述>` 由**用户主动**触发：想把一个**整体模块 / 历史能力**一次性解析入库时使用，输入路径或多文件聚合，适合从未入库的整块代码。 `f2s-kb-sync` 由**用户主动**触发：用于已实现能力的**全局 / 批量同步**，可零输入推断，先输出更新大纲再落盘，适合阶段性体检式补强。简言之：**单次问答 → distill（Agent 自动），新模块整体入库 → add，多个已落地能力一次性同步 → sync**。 > 每次「从源码里找答案」，都可能变成一次知识库补强。 --- ## 十三、适合什么项目 \+ 快速体验

适合什么项目与快速体验

**最适合**：中大型业务项目、长期维护的代码仓库、多人协作规则很多的项目、经常使用 Cursor / Claude Code / Codex 的团队、希望 AI 不只是"看文档"而是参与维护项目知识的场景。 **可能不适合**：一次性脚本或非常小的个人项目（\< 5000 行，一份 README 够用）。 **5 分钟快速体验**： ```Plain Text npx @double-codeing/flow2spec@latest init ``` 开始使用时建议优先显式输入`f2s-*` skill，熟悉这些技能的用法，可以更高效地使用 Flow2Spec。默认开启 `intentRecognition` 即可让 Agent 在常见任务下自动分流。常用流程： ```Plain Text /f2s-req-clarify 需求澄清 /f2s-req-tech 生成技术方案 /f2s-kb-feat 新增能力并同步知识 /f2s-kb-fix 修复问题并修正知识 /f2s-kb-add <路径> 解析已有模块入库 /f2s-kb-sync 全局/批量同步已落地能力到知识库 /f2s-kb-distill 把本轮问答提取入库（自动判新主题或补充既有主题） /f2s-git-commit 提交前检查并生成提交信息 ``` 目前已支持 Cursor、Claude Code、Codex 三端初始化，也支持中文 / 英文模板。 --- ## 结语

AI 编程的终点不是"写更多代码"。真正难的是：**让 AI 在长期项目里持续理解上下文，并且把每次开发产生的新知识沉淀下来。** Flow2Spec 把项目知识从静态文档变成可路由、可依赖、可验证、可反哺的知识图谱。它让 Agent 不只是消费上下文，也参与维护上下文。如果你的项目已经出现"每次都要给 AI 解释同一套业务规则"、"AI 经常漏读前置约束"、"文档和代码越来越不同步"这类问题，可以试一下： ```Plain Text npx @double-codeing/flow2spec@latest init ``` 开源地址：`https://github.com/Lands-1203/Flow2Spec` PPT演示：`https://lands-1203.github.io/Flow2Spec/` ---

觉得 Flow2Spec 对你有帮助的话，欢迎去 GitHub 点个 Star，你的支持是持续开发的动力！ 👉 **https://github\.com/Lands\-1203/Flow2Spec** ---