--- title: "SchemaFlow: Agentic Database Change Impact Analysis, SQL Generation, and Eval Guardrails" source: rss source_url: https://developers.openai.com/cookbook/examples/partners/schemaflow_design_guide/schemaflow_cookbook ingested: 2026-06-09 sha256: pending author: OpenAI Cookbook (partner: SchemaFlow) tags: [agent, harness, openai, sql, eval, ratchet, pydantic, guardrails] type: article review_value: 8 review_confidence: 9 review_recommendation: strong review_stars: 4 --- # SchemaFlow: Agentic Database Change Impact Analysis, SQL Generation, and Eval Guardrails > 原文存档:OpenAI Cookbook 合作伙伴示例,演示 staged agentic workflow 用于数据库变更影响分析 + SQL 生成 + 评估护栏。 ## 核心定位 OpenAI 官方 Cookbook 的 SchemaFlow 合作伙伴案例,展示**生产级 agentic workflow 的完整架构**——从 PDF 文档 RAG 检索、staged 任务拆分、SQL 生成、影响分析到 Promptfoo 评估护栏。这是 OpenAI 在"agent harness engineering"上的范本演示。 ## 关键设计模式 - **Staged agentic workflow**:5 阶段流水线(Parse Change Request → Impact Analysis → SQL Generation → Validation → Eval),每阶段独立可观测 - **Pydantic schema 强类型约束**:所有 stage 输出用 Pydantic model 校验,类型错误立即重试 - **PDF RAG context**:将数据库 schema PDF 文档分块向量化,作为 LLM 上下文的一部分 - **Promptfoo eval guardrails**:用 Promptfoo 做 SQL 安全/正确性评估,失败时阻断执行 ## 评估护栏 - **SQL injection detection**:Promptfoo rules 检测危险模式(`DROP TABLE`、`DELETE FROM` 无 WHERE 等) - **Schema drift check**:生成的 SQL 与目标 DB schema 实时比对 - **Cost/latency budgets**:每个 stage 单独监控 token 用量和响应时间 - **Regression suite**:固定测试集确保迭代不破坏已有功能 ## 实践启示 1. **Harness = staged pipeline + 强类型 schema + 评估门**:不是单次 LLM 调用,而是 5 个独立 stage 串起来的工程化系统 2. **官方 Cookbook 是 harness 范本**:Anthropic、OpenAI 都在用 staged agentic workflow 解决复杂任务,单 prompt 是 2024 范式 3. **Eval guardrails 不是可选**:生产 SQL 生成必须配合 Promptfoo 之类的 evaluator,否则 hallucination 直接进生产库 ## 原文链接 [SchemaFlow Cookbook](https://developers.openai.com/cookbook/examples/partners/schemaflow_design_guide/schemaflow_cookbook)