[中文](../Flow2Spec基础介绍.md) | [English](./Flow2Spec-Introduction.md) · [项目首页](../../README.zh-CN.md) | [Project home](../../README.md) # Flow2Spec:让项目在开发中自然长出知识图谱

Flow2Spec 封面

--- ## 一、前言

前言

最近一年,很多 AI 编程工具都在解决同一个问题:**让 Agent 记住项目上下文。** 这件事当然重要。但现在只说"项目记忆""上下文管理""规则文件",已经不够了。 因为很多开源项目都在做类似的事:写一个 `AGENTS.md` / `CLAUDE.md`,加一组 rules,建一个 docs 目录,让 Agent 先读项目说明,或者接入向量库做检索。 这些方案能缓解问题,但我真正想解决的不是"启动时塞给 AI 一堆上下文"。我想解决的是: **在真实开发过程中,项目知识能不能被持续沉淀、自动路由、持续验证,并且随着代码一起演进。** 这就是 Flow2Spec。一句话介绍:**Flow2Spec 是一个让项目在开发过程中自然长出知识图谱的 Agent 工程框架。** --- ## 二、只做"记忆"为什么不够

只做记忆为什么不够

很多项目接入 AI 后,会很快遇到一个悖论:你希望 AI 多了解项目,但你给它的上下文越多,它越容易读不完、读偏、忘掉重点。 于是大家不断加规则:先读这个文件,再读那个目录,这个模块不能改,那个接口有历史兼容,改完记得更新文档……最后上下文变成另一种负担。它看起来像知识库,实际上更像一个不断膨胀的说明书。 Flow2Spec 的判断是:**项目知识不能只靠"写下来",还要能被路由、被组合、被校验、被持续更新。** --- ## 三、Flow2Spec 的关键差异:开发过程生成知识图谱

开发过程生成知识图谱

Flow2Spec 不是要求你先做一场大规模文档工程。它更推荐的方式是: 1. 先 `flow2spec init` 初始化一个空骨架 2. 用 `f2s-doc-arch` 生成项目架构说明,沉淀进知识库 3. 真实需求来了,Agent 先按现有知识路由 4. 功能实现后,用 `f2s-kb-sync` 把本轮确认的事实同步回知识库 5. 下一次类似需求,再从这份知识中渐进读取 **知识不是一次性建设出来的。它是在需求澄清、技术方案、代码实现、修复问题、知识同步、提交代码的过程中逐步长出来的。** 这也是 Flow2Spec 和普通"项目记忆文件"的区别:普通方案更像给 Agent 一份说明书;Flow2Spec 更像给项目维护一张可演进的知识图谱——落在仓库里的 `.Knowledge/` 中,能 diff、能 review、能随代码提交。 --- ## 四、知识库接口:不是一个大文档,而是一套路由协议

知识库路由协议

Flow2Spec 的知识库有一个明确的接口结构: ```Plain Text .Knowledge/ manifest-routing.json # 机读路由清单 matchers/ # 关键词分片 topics/ # 主题摘要 stock-docs/ # 已落地能力长文档 req-docs/ # 需求 / 技术方案文档 ``` Agent 的读取顺序不是自由发挥,而是按协议走: ```Plain Text manifest-routing.json -> matcher 分片(matcherPath 指向的单个文件) -> match(主候选) -> expand(先依赖 topic,再主 topic;保留次高候选) -> verify(缺口检查) -> 足够:act -> 不足:stock-docs / req-docs(按需) -> 仍不足:源码兜底 -> act 或澄清 ``` 图 1:知识库渐进式读取 ```mermaid flowchart LR subgraph entry["路由入口"] direction LR A["manifest-routing.json
机读路由清单"] --> B["matchers
关键词分片"] end B --> M["match
主候选"] M --> E["expand
先依赖 topic,再主 topic
+ 次高候选"] E --> V{"verify
缺口检查"} V -->|足够| H["act
执行 / 澄清 / 补知识提示"] V -->|不足| F["stock-docs / req-docs
长文档(按需)"] F --> V2{"仍不足?"} V2 -->|是| G["源码兜底"] V2 -->|足够| H G --> H entry ~~~ M ``` 这套结构的价值在于:**知识库对 Agent 暴露的不是"文件",而是"怎么找到正确知识"的接口。** `manifest-routing.json` 告诉 Agent 有哪些主题;`matchers/*.json` 告诉 Agent 这个需求可能命中哪些主题;`topics/*.md` 给 Agent 短摘要和硬约束;`topicDependencies` 告诉 Agent 哪些前置规则必须一起读;`stock-docs/` 和 `req-docs/` 只在需要时下钻。 --- ## 五、渐进式读取:AI 每次只拿该拿的知识

渐进式读取

Flow2Spec 的读取模型可以概括成四步:**match → expand → verify → act** **match**:Agent 先读 `manifest-routing.json`,再按任务读取对应 matcher 分片。不遍历整个知识库,先缩小候选范围。 **expand**:命中主主题后,通过 `topicDependencies` 继续读取依赖主题,避免只看到局部规则。比如一个功能可能同时依赖公共配置规则、鉴权规则、某个业务模块的约束。 **verify**:命中 topic 不代表知识一定够。Flow2Spec 要求 Agent 在执行前检查:当前主题是否真的覆盖用户问题,是否缺关键依赖,是否需要读长文档,是否需要先反问用户。这一步把"看起来命中了"变成"确认可以执行"。 **act**:只有在知识覆盖足够、边界清楚时,Agent 才进入实现、修改或提交。如果置信度不足,就先澄清,而不是硬改。 --- ## 六、多依赖能力:不让 Agent 只读到一半规则

多依赖能力

真实项目里,很多错误不是因为 AI 完全没读知识,而是它只读了一个局部知识,漏掉了前置约束: - 改功能时读了业务 topic,但没读提交规则 - 生成技术方案时读了需求文档,但没读 req\-docs / stock\-docs 的边界规则 - 修改配置时读了模块说明,但没读配置开关默认值 Flow2Spec 把这些依赖显式放进路由层。一个 topic 可以声明它依赖哪些 topic,Agent 命中主主题时会先展开依赖。这不是简单的"多读几个文件",而是把项目知识从扁平文档变成有边的图: ```Plain Text 需求实现 -> 文档路由规则 -> 技术方案规则 -> 任务追踪规则 -> Git 提交规则 ``` 这让 Agent 每次读取的不是孤立片段,而是一组经过声明的上下文组合。 --- ## 七、知识库正确性:不是写了 topic 就算完

知识库正确性

知识库最怕两件事:过期和写错。Flow2Spec 没有假设知识库永远正确,它把"验证"放进了开发流程。 典型场景:用户问一个业务细节,Agent 先查知识库,发现 topic 有覆盖但不够细,继续读源码得到更准确的事实。这时 Flow2Spec 不应该只回答完就结束,还要判断: - 这个事实是否已经写进 topic - 如果没写或不够细,是否应该提示用 `f2s-kb-distill` 把本轮问答提取入库 - 如果知识看起来已覆盖,是否能证明覆盖来源;不能证明就不能静默 这就是"知识库补充建议收口"。**它让 AI 从源码里找到的每次新知识,都不只留在本次聊天里,而是反哺回知识库。** --- ## 八、用户意图识别:不是所有话都应该自动进流程

用户意图识别

用户说一句话,Agent 到底应该回答、讨论、澄清,还是直接进开发流程? - "这个方案可行吗?" → 应该是讨论,不应该自动开始写代码 - "修一下这个 bug" → 应该进入 fix 流程 - "我想做一个新能力,先帮我把需求问清楚" → 应该进入需求澄清,而不是直接实现 Flow2Spec 里有 `intentRecognition` 开关,开启后 Agent 会按意图识别规则做辅助判断:高置信新增能力进入 feat 流程,高置信修复问题进入 fix 流程,需求不清楚进入 req\-clarify,只是询问/讨论则保持普通对话。 经过一段时间真实项目验证,**意图识别已经比较稳定,建议默认开启**,让 Agent 在大多数场景下自动分流;当然你也可以随时显式输入 `f2s-req-clarify`、`f2s-kb-feat`、`f2s-kb-fix` 等命令,覆盖自动判断结果。建议多显式使用 f2s\-\* skill**,熟悉这些技能的用法,可以更高效地使用 Flow2Spec。 --- ## 九、一个更真实的开发闭环

开发闭环

使用 Flow2Spec 后,一个需求可能是这样流动的: ```Plain Text 用户提出需求 -> 显式 f2s-* skill / intentRecognition 辅助判断 -> f2s-req-clarify 反问到无歧义 -> f2s-req-tech 生成技术方案 -> Agent 按知识库渐进读取 -> 实现代码 -> changeTracking 记录任务进度 -> f2s-kb-sync 同步新知识 -> f2s-git-commit 提交前检查 ``` 图 2:开发过程生成知识图谱 ```mermaid flowchart TD A[用户提出需求] --> B{显式 f2s-* skill
或 intentRecognition 辅助判断} B -->|需求不清| C[f2s-req-clarify
需求澄清] B -->|新增能力| D[f2s-kb-feat
新增能力] B -->|修复问题| E[f2s-kb-fix
修复问题] B -->|大需求 / 需方案| F[f2s-req-tech
技术方案] C --> F D --> G[渐进式读取
match -> expand -> verify -> act] E --> G F --> G G --> H[代码实现 / 修复] H --> I[changeTracking
任务进度落盘] H --> J[f2s-kb-sync
同步已确认事实] J --> K[.Knowledge
知识图谱增量更新] I --> L[f2s-git-commit
提交前检查] K --> L L --> M[下一次类似需求
复用知识] M --> G ``` 这条链路里,每一步都会留下可追踪的资产:需求文档在 `req-docs/`,已落地知识在 `stock-docs/`,主题摘要在 `topics/`,路由关系在 `manifest-routing.json`,任务进度在 `.task/`。 **Flow2Spec 做的不是"让 AI 单次回答更好",而是在把一次次开发过程转化为项目知识图谱的增量更新。** --- ## 十、它不只管知识,也管开发闭环

开发闭环管理

**任务进度落盘**:开启 `changeTracking` 后,Agent 执行功能开发或方案实现时,会把任务 checklist 写到 `.task/`。新会话继续做时,不需要重新问"上次做到哪",直接从磁盘任务接上。 **技术方案不硬套模板**:`f2s-req-tech` 会根据当前需求选择合适的技术方案结构,而不是把所有章节机械套一遍,避免前端改造也生成一堆数据库章节。 **多 Agent 编排与校验**:复杂任务可以通过 `subAgent` 拆给子 Agent 处理。如果开启 `switchAgentVerification`,还可以让写入方和验证方分离,降低单个 Agent 自己写、自己验、自己放过的风险。 **提交前知识覆盖检查**:`f2s-git-commit` 会在提交前检查 diff、冲突标记、暂存范围,也会检查本轮变更是否需要同步知识库,让"改代码后忘记更新知识"在提交前能被发现。 **模板与路由升级检测**:Flow2Spec 启动时会检测 `.Knowledge/` 结构版本,如果落后于 npm 包版本,Agent 会提示执行 `f2s-kb-upgrade`,确保项目知识结构与工具版本保持同步。 --- ## 十一、和普通知识库最大的区别

与普通知识库的区别

如果只用一句话概括差异:**普通知识库是给 Agent 查的;Flow2Spec 的知识库是给 Agent 参与维护的。** 图 3:普通记忆文件 vs Flow2Spec 知识图谱 ```mermaid flowchart LR L1["大文档 / rules / docs"] --> L2["Agent 自己翻找"] --> L3["答完即结束"] ``` ```mermaid flowchart LR R5{"缺口验证"} R6["源码兜底"] R7["知识反哺 / 提交检查"] R1["manifest 路由"] R2["matcher 命中"] R3["topic 摘要"] R4["依赖展开"] R5 -->|不足| R6 R6 --> R7 R5 -->|足够| R7 R7 --> R1 --> R2 --> R3 --> R4 R4 --> R5 ``` 普通知识库关注:文档放在哪里、怎么检索、怎么总结。 Flow2Spec 更关注:需求来了该读哪个主题、主题之间有什么依赖、当前知识是否足够执行、源码兜底后是否要反哺、用户意图是否应该触发流程、改代码后知识是否一起更新、提交前是否检查过知识覆盖。 这也是为什么 Flow2Spec 会同时包含 `.Knowledge/`、`.task/`、`f2s-*` skills、Agent rules 和 `flow2spec.config.json`——它们不是散件,而是一套围绕开发闭环组织起来的协议。 --- ## 十二、几个常见问题

常见问题

**Q:改动一个能力后,怎么保证对应主题都能更新?** Flow2Spec 不承诺「模型一定自动知道所有影响面」,而是把影响面发现变成一套可执行流程。 一次能力改动通常不只对应一个 topic。例如改了「批量重评分」,可能同时影响: | 类型 | 需检查的内容 | | --- | --- | | 业务能力 topic | 这个功能现在怎么工作 | | 配置 topic | 开关、默认值、阈值有没有变化 | | 规则 topic | 幂等、锁、错误码、提交前检查有没有变化 | | 模块 topic | 公共方法、目录边界、调用链有没有变化 | Flow2Spec 通过五层机制提高覆盖率: 1. 路由层:matcher 找主 topic 2. 依赖展开:`topicDependencies` 展开依赖 topic 3. 同步确认:`f2s-kb-sync` 先给出更新大纲,让用户确认 4. 问答收口:普通问答下钻源码后,发现缺口则提示补充 5. 提交门禁:`f2s-git-commit` 提交前做知识覆盖检查 **举例**:改「活动抽奖次数」时,知识更新不应只写「抽奖接口改了」,还可能要同步: - 活动业务 topic:抽奖次数怎么计算 - 数据模型 topic:哪些字段记录已领取 / 剩余次数 - 规则 topic:浏览任务、购买任务、重复领取的限制 - 配置 topic:奖品列表、开关、活动时间 > Flow2Spec 的目标不是让 Agent 凭感觉改一个文件,而是先列出「这次变更可能影响哪些主题」,确认后再落盘。 --- **Q:Flow2Spec 怎么解决 Agent 遗忘规则的问题?** 分两侧看。 **使用侧**:规则不塞进一个大文件,而是拆成可路由、可依赖的结构——入口规则写进各端配置、业务知识放进 `topics`、匹配词放进 `matchers`、依赖关系放进 `topicDependencies`、长文档放进 `stock-docs` / `req-docs`。Agent 每次不靠记忆,而是按 `match → expand → verify → act` 重新取规则。 **设计侧**:五层约束分阶段拦截「规则写了但不遵守」的情况: 1. 入口层:声明读取顺序和禁止项 2. 配置层:执行任何技能前必须先读配置开关 3. 路由层:所有任务先读 manifest,不直接全仓搜索 4. 技能层:每个技能定义前置检查、确认点和收口方式 5. 门禁层:在多个节点分别设门禁——任务归档前检查 checklist、知识落盘前确认大纲、问答下钻源码后强制收口自检、代码提交前检查 diff 与知识覆盖 两个典型场景说明这五层如何生效:一是防止意图误判(用户还在澄清阶段,Agent 不能跳去实现);二是防止源码答完后知识不反哺(必须判断是否需要 `f2s-kb-distill` 把本轮问答提取入库,不允许静默跳过)。 Flow2Spec 的目标不是完全消除遗忘,而是让「绕过规则」在每个阶段都更难发生。 --- **Q:单个主题文件过大怎么办?** topic 的定位是「路由摘要」:记触发词、边界、关键约束和下一步指针,不承载所有细节。长内容放 `stock-docs/`;大功能拆成多个 focused topic,再用 `topicDependencies` 串起来。 **拆分示例**(一万行代码的大功能): ```text topics/ 活动概览.md 活动任务规则.md 活动数据模型.md 活动外部依赖.md stock-docs/ 活动概述_终稿.md 活动任务规则_终稿.md 活动数据模型_终稿.md 活动外部依赖_终稿.md ``` Agent 先读「活动概览」判断相关性;问任务状态机 → 读「活动任务规则」;问表字段 → 读「活动数据模型」。 这样可避免:topic 太大读不完抓不住重点,或触发词太杂导致一个主题什么需求都命中。 --- **Q:如果知识库没有覆盖当前模块怎么办?** Flow2Spec 提供三个互补命令,按触发方式与粒度区分: `f2s-kb-distill` 由 **Agent 自动提示**:在一次问答中下钻源码找到答案后,把本轮问答提取入库;技能内部会按下钻深度与命中主题,自动判新建主题或补充既有主题。 `f2s-kb-add <路径或能力描述>` 由**用户主动**触发:想把一个**整体模块 / 历史能力**一次性解析入库时使用,输入路径或多文件聚合,适合从未入库的整块代码。 `f2s-kb-sync` 由**用户主动**触发:用于已实现能力的**全局 / 批量同步**,可零输入推断,先输出更新大纲再落盘,适合阶段性体检式补强。 简言之:**单次问答 → distill(Agent 自动),新模块整体入库 → add,多个已落地能力一次性同步 → sync**。 > 每次「从源码里找答案」,都可能变成一次知识库补强。 --- ## 十三、适合什么项目 \+ 快速体验

适合什么项目与快速体验

**最适合**:中大型业务项目、长期维护的代码仓库、多人协作规则很多的项目、经常使用 Cursor / Claude Code / Codex 的团队、希望 AI 不只是"看文档"而是参与维护项目知识的场景。 **可能不适合**:一次性脚本或非常小的个人项目(\< 5000 行,一份 README 够用)。 **5 分钟快速体验**: ```Plain Text npx @double-codeing/flow2spec@latest init ``` 开始使用时建议优先显式输入`f2s-*` skill,熟悉这些技能的用法,可以更高效地使用 Flow2Spec。默认开启 `intentRecognition` 即可让 Agent 在常见任务下自动分流。 常用流程: ```Plain Text /f2s-req-clarify 需求澄清 /f2s-req-tech 生成技术方案 /f2s-kb-feat 新增能力并同步知识 /f2s-kb-fix 修复问题并修正知识 /f2s-kb-add <路径> 解析已有模块入库 /f2s-kb-sync 全局/批量同步已落地能力到知识库 /f2s-kb-distill 把本轮问答提取入库(自动判新主题或补充既有主题) /f2s-git-commit 提交前检查并生成提交信息 ``` 目前已支持 Cursor、Claude Code、Codex 三端初始化,也支持中文 / 英文模板。 --- ## 结语

结语

AI 编程的终点不是"写更多代码"。真正难的是:**让 AI 在长期项目里持续理解上下文,并且把每次开发产生的新知识沉淀下来。** Flow2Spec 把项目知识从静态文档变成可路由、可依赖、可验证、可反哺的知识图谱。它让 Agent 不只是消费上下文,也参与维护上下文。 如果你的项目已经出现"每次都要给 AI 解释同一套业务规则"、"AI 经常漏读前置约束"、"文档和代码越来越不同步"这类问题,可以试一下: ```Plain Text npx @double-codeing/flow2spec@latest init ``` 开源地址:`https://github.com/Lands-1203/Flow2Spec` PPT演示:`https://lands-1203.github.io/Flow2Spec/` ---

GitHub Star

觉得 Flow2Spec 对你有帮助的话,欢迎去 GitHub 点个 Star,你的支持是持续开发的动力! 👉 **https://github\.com/Lands\-1203/Flow2Spec** ---