# 贡献指南与本地质量门禁这份文档说明贡献代码前应该如何在本地安装、开发、测试和运行质量门禁。目标是让维护者和贡献者都能在提交 PR 前回答一个问题：这次改动有没有破坏核心 Coding Agent 工作流。 ## 环境准备项目根目录使用 Bun： ```bash bun install ``` 如果改动涉及 `desktop/`，也安装桌面端依赖： ```bash cd desktop bun install ``` 如果改动涉及 `adapters/`，或者要运行 `check:adapters` / `check:native`，安装 adapter 依赖： ```bash cd adapters bun install ``` 不要提交本地运行产物，例如 `artifacts/quality-runs/`、`node_modules/`、`desktop/node_modules/`。 ## 普通 PR 必跑门禁普通贡献者和 AI Coding Agent 在提交 PR 前统一运行： ```bash bun run verify ``` `bun run verify` 是一键入口，等价于 `bun run quality:pr`。这个门禁不调用真实大模型，适合所有人本地运行。它会先生成 impact report，再按改动范围真实执行被选中的本地门禁：policy、desktop、server、adapters、native、docs、quarantine 和覆盖率。命令失败就说明当前分支还不能提交 PR 或 push。主质量报告会内嵌当前测试范围、结果矩阵、覆盖率摘要，并链接完整 coverage/JUnit/log artifact： ```text artifacts/quality-runs//report.md artifacts/quality-runs//report.json artifacts/quality-runs//junit.xml artifacts/quality-runs//logs/*.log artifacts/coverage//coverage-report.md artifacts/coverage//coverage-report.json ``` PR 描述里请贴出你实际运行的命令和 summary。`quality:pr` / `quality:verify` 仍然保留给习惯显式质量命名的用户，但推荐文档和 AI prompt 都使用 `bun run verify`。覆盖率门禁同时执行四件事：按源码口径统计覆盖率、执行 baseline ratchet、报告 75-80%+ 的目标差距，并对新增/变更的可执行生产代码行执行 changed-line coverage。当前 baseline 记录在 `scripts/quality-gate/coverage-baseline.json`，CI 会优先对比 base branch 的 baseline，新增 PR 不允许覆盖率下降超过允许窗口。`coverage-baseline.json` 或 `coverage-thresholds.json` 变更必须由维护者加 `allow-coverage-baseline-change` 后才能合并。Quarantine 条目必须有 owner、reviewAfter 和 exitCriteria；reviewAfter 过期后默认 server/coverage gate 会阻断，直到维护者处理。 ## AI Coding Agent 修复循环给 AI 写代码时，可以直接把这段作为验收指令： ```text Run `bun run verify`. If it fails, read the latest `artifacts/quality-runs//report.md` and the relevant lane log, fix the missing tests, coverage failures, type/lint/build errors, or docs/native failures, then rerun `bun run verify` until it passes. Do not lower coverage baselines or thresholds unless a maintainer explicitly requested it. ``` Agent 应按这个顺序处理失败： 1. 先看 `artifacts/quality-runs//report.md` 的 Summary 和 Result Matrix，定位失败 lane。 2. 如果是 `Path-aware PR checks` 失败，优先看是否缺同区域测试、是否动了 CLI core、是否动了 coverage policy；不要用 override 绕过普通功能 PR。 3. 如果是 `Coverage gate` 失败，打开 `artifacts/coverage//coverage-report.md` 或 `coverage-report.json`，优先修 `changedLines.failures` 和 `failures`；`targetGaps` 是技术债提示，新改动应让触达区域变好。 4. 如果是 desktop/server/adapters/native/docs 失败，读对应 `artifacts/quality-runs//logs/.log`，补测试或修构建，再跑相关窄命令。 5. 窄命令通过后，最后必须再跑一次 `bun run verify`。只有最终 Summary 是 `failed=0`，才可以说 ready。外部参考口径： - [Google Testing Blog](https://testing.googleblog.com/2020/08/code-coverage-best-practices.html)：60% acceptable、75% commendable、90% exemplary；changed/per-commit coverage 90% 是合理下限。 - [Microsoft Visual Studio / Azure DevOps 文档](https://learn.microsoft.com/en-us/visualstudio/test/using-code-coverage-to-determine-how-much-code-is-being-tested)：团队通常以约 80% 为目标，典型项目要求可为 75%，生成代码可以放宽。 - [ChromiumOS EC](https://chromium.googlesource.com/chromiumos/platform/ec/+/main/docs/code_coverage.md)：新增或变更行要求至少 80% 覆盖。 ## Feature Quality Contract 所有新功能、bugfix 和行为变化都必须带着可验证证据交付。这条规则同时约束人和 AI Coding Agent： - 先声明变更面：`desktop`、`server`、`adapter`、`native`、`docs`、`provider/runtime`、`agent-loop` 或 `release`。 - `desktop/src`、`src/server`、`src/tools`、`src/utils`、`adapters` 下的生产代码变更必须同 PR 带同区域测试；除非维护者显式加 `allow-missing-tests`。 - 纯逻辑写单元测试；server/API/provider/runtime 写 API 或 request-shape 测试；桌面 UI/store/API 写 Vitest/Testing Library；跨 UI、WebSocket、provider proxy、native sidecar、发布打包的用户流程要补 E2E 或 agent-browser smoke。 - agent loop、工具调用、provider 路由、模型选择、文件编辑、权限、会话恢复、桌面聊天改动，PR 内必须有 mock/fixture 测试；有 provider 条件时还要给 live smoke 或 baseline 证据。 - 覆盖率是功能的一部分。本项目按 Google/Microsoft 风格执行：生成物/构建产物不计入产品覆盖率，维护中的产品区域要逐步达到 75-80%+，新增或变更的可执行生产代码行必须满足 `coverage-thresholds.json` 里的 changed-line coverage 门槛。 - 不要为了过门禁随便降低 `coverage-baseline.json` 或 `coverage-thresholds.json`；确实要改时必须有 `allow-coverage-baseline-change` 和原因。历史低覆盖区域是技术债，新 PR 至少要让触达区域更好。 - PR 描述必须写清楚：改了哪些文件、补了哪些测试、coverage 报告路径、E2E/live 报告路径或 blocker、剩余风险。 ## 本机 Push 前门禁 Git hook 不能提交到远端自动生效，所以每个 clone 需要安装一次： ```bash bun run hooks:install ``` 安装后，每次 `git push` 都会先运行同一套验证入口（内部是 `bun run quality:pr`，等价于 `bun run verify`）。如果单元测试、覆盖率、文档/native/adapter 等按路径选中的门禁失败，push 会被本机 hook 阻断。维护者或有模型额度的贡献者可以把真实 provider smoke 和桌面 agent-browser smoke 也纳入 push 前门禁： ```bash bun run quality:providers bun run hooks:install -- --live-provider-model minimax:main:minimax-main ``` 需要每次 push 前跑完整 live baseline 时使用： ```bash bun run hooks:install -- --live-provider-model minimax:main:minimax-main --live-mode baseline ``` 这些选项写入本机 `.git/config` 的 `quality.prePush*` 配置，不会提交 provider selector 或密钥。`smoke` 模式覆盖真实 provider 连通性和桌面 UI 聊天 smoke；`baseline` 模式会额外跑全部真实 Coding Agent baseline case。维护者级 override 也必须显式写入本机配置，hook 才会传给 `quality:pr`： ```bash bun run hooks:install -- --allow-cli-core-change --allow-coverage-baseline-change ``` 这只影响当前 clone，不会提交到仓库；PR 侧仍然需要对应 label。 ## PR CI 合并门禁 `.github/workflows/pr-quality.yml` 会在 PR `opened`、`synchronize`、`reopened`、`ready_for_review`、`labeled`、`unlabeled` 时触发。流程先运行 `change-policy`，根据变更文件决定是否需要 desktop、server、adapter、native、docs 和 coverage lane。最后的 `pr-quality-gate` 会汇总所有被选中的 job：选中 job 失败则 `pr-quality-gate` 失败，未选中的 job 可以是 skipped。仓库侧应在 GitHub branch protection / ruleset 中保护 `main`，并把 `pr-quality-gate` 设为 required status check。这样本机 hook 防止低质量 push，PR 侧防止低质量 merge。 ## 按改动范围补充测试根据你改动的区域补充运行： ```bash bun run check:server # 服务端 API、WebSocket、provider、会话等测试 bun run check:desktop # 桌面端 lint、Vitest、生产构建 bun run check:adapters # IM adapter 测试 bun run check:native # 桌面 sidecar 与 Tauri native 检查 bun run check:docs # 文档构建，使用 npm ci + docs:build bun run check:quarantine # quarantine owner、退出条件和复审日期 bun run check:coverage # root、desktop、adapters 覆盖率报告和 ratchet 门禁 ``` 如果只改了很窄的文件，也可以先跑对应的定向测试，但 PR 前仍应跑 `bun run verify`。生产代码改动必须带对应测试文件：`desktop/src/**`、`src/server/**`、`src/tools/**`、`src/utils/**`、`adapters/**` 变更如果没有同区域测试，会触发阻断。只有维护者确认不适合自动化测试时，才能使用 `allow-missing-tests`。覆盖率 baseline/threshold 变更同样需要维护者确认并加 `allow-coverage-baseline-change`。 ## 真实模型 Baseline `quality:baseline` 用来跑真实 Coding Agent 任务：启动本地服务端、创建隔离 fixture、让模型通过聊天修代码、跑测试，并保存 transcript、diff、verification log 和报告。它还会对 provider 进行 live smoke：已保存或当前激活的 OpenAI-compatible provider 会验证连通性、proxy 转换和流式 proxy 结果；env-only provider smoke 只验证上游连通性和转换管线。默认命令不会调用真实模型： ```bash bun run quality:baseline ``` 要真正跑模型，必须显式加 `--allow-live` 并选择本机 provider。先列出本机可用 provider 和可复制参数： ```bash bun run quality:providers ``` 输出示例： ```text Saved providers: MiniMax selector: minimax main: MiniMax-M2.7-highspeed --provider-model minimax:main:minimax-main ``` 复制输出里的参数运行 baseline： ```bash bun run quality:gate --mode baseline --allow-live --provider-model minimax:main:minimax-main ``` 如果只需要跑 provider smoke 和桌面 agent-browser smoke，而不跑全部 baseline case，可以使用： ```bash bun run quality:smoke --provider-model minimax:main:minimax-main ``` 可以一次跑多个模型： ```bash bun run quality:gate --mode baseline --allow-live \ --provider-model codingplan:main:codingplan-main \ --provider-model minimax:main:minimax-main ``` `provider` selector 来自桌面端「Settings > Providers」里保存的本机配置。别人 clone 代码后不需要知道你的 provider UUID，也不需要使用你的供应商；他们可以在自己的桌面端添加 provider 后运行 `bun run quality:providers` 选择自己的模型。如果没有保存 provider，也可以用环境变量跑一条 unsaved provider smoke： ```bash QUALITY_GATE_PROVIDER_BASE_URL=https://example.com \ QUALITY_GATE_PROVIDER_API_KEY=... \ QUALITY_GATE_PROVIDER_MODEL=model-id \ QUALITY_GATE_PROVIDER_API_FORMAT=openai_chat \ bun run quality:gate --mode baseline --allow-live ``` ## 什么时候必须跑 Baseline 以下改动建议跑 live baseline： - 桌面聊天、会话恢复、WebSocket、CLI bridge - provider/model/runtime 选择 - 权限、工具调用、文件编辑、任务执行 - agent-browser smoke、Computer Use、Skills、MCP - release 前或风险较大的跨模块重构如果没有模型额度，至少运行 `bun run verify`，并在 PR 里说明未跑 live baseline 的原因。 ## Release 门禁发版前使用 release 模式： ```bash bun run quality:gate --mode release --allow-live --provider-model :main ``` release 模式会组合 PR checks、baseline catalog、live baseline、desktop smoke 和 native checks。发版报告同样写入 `artifacts/quality-runs//`。线上 release workflow 在打包矩阵前会先跑 `quality:gate --mode pr` 作为非 live 预检，并上传 `release-quality-gate` artifact；真实 live release gate 仍需要维护者用可用 provider 显式运行。 release 模式下 live lane 不允许静默跳过。缺少 provider、真实模型额度或外部账号时，门禁会失败，并要求在发版记录里明确 blocker。 ## PR 提交流程 1. 新建普通产品分支，例如 `fix/session-reconnect` 或 `feat/provider-quality-gate`。 2. 安装依赖并完成改动。 3. 为行为变化补测试。 4. 运行相关定向测试。 5. 可选但推荐：运行 `bun run hooks:install`，让后续 push 自动卡住失败门禁。 6. 运行 `bun run verify`。 7. 对高风险改动运行 live baseline。 8. 在 PR 描述里写清楚用户影响、测试命令、覆盖率/质量报告 summary、已知风险。 ## 常见问题 ### 没有 provider 可以跑吗？可以跑普通门禁： ```bash bun run verify ``` 只有 live baseline 需要真实模型。先在桌面端 Settings > Providers 添加自己的 provider，再运行： ```bash bun run quality:providers ``` ### provider selector 冲突怎么办？如果两个 provider 名称生成了相同 selector，`quality:providers` 会退回输出 provider ID。直接复制它给出的 `--provider-model ...` 即可。 ### 模型 ID 里带冒号怎么办？优先使用角色选择，例如： ```bash --provider-model custom:haiku:custom-haiku ``` 脚本会把 `haiku` 解析成本机 provider 配置里的真实模型 ID。