--- tags: [wechat, article, claude, openai] title: "gepa optimize anything universal text optimization" type: raw url: https://gepa-ai.github.io/gepa/blog/2026/02/18/introducing-optimize-anything/ ingested: 2026-05-08 sha256: 9f960c14545369cea3a9a27790f56bf56188b513782d049b8af3c4ffaa03775c review_value: 8 review_confidence: 8 review_stars: 4 review_product: 64 review_recommendation: STRONG source: GEPA官方博客 published: 2026-02-18 created: 2026-05-10 updated: 2026-05-10 --- # optimize_anything: A Universal API for Optimizing any Text Parameter **来源：** GEPA 官方博客 **发布时间：** 2026-02-18 **作者：** GEPA Team **链接：** https://gepa-ai.github.io/gepa/blog/2026/02/18/introducing-optimize-anything/ ## 核心内容 **GEPA**（Genetic-Pareto）团队发布 `optimize_anything`，一个声明式 API，通过 ASI（诊断反馈）+ Pareto 前沿搜索对任何文本制品进行优化。扩展自 GEPA 的 prompt 优化器，支持三大优化模式。 ### 核心 API ```python import gepa.optimize_anything as oa def evaluate(candidate: str) -> float: score, diagnostic = run_my_system(candidate) oa.log(f"Error: {diagnostic}") # captured as ASI return score result = oa.optimize_anything( seed_candidate="", evaluator=evaluate, ) ``` 核心组件： - **Artifact**：任何可序列化为文本的内容（代码/prompt/Agent架构/配置/向量图形） - **Evaluator**：接受候选文本，返回分数 + ASI（诊断反馈） - **ASI（Actionable Side Information）**：诊断反馈的一等公民概念，类似数值优化中的梯度，告诉 LLM 候选为何失败及如何修复 ### 三种优化模式 | 模式 | 说明 | 先前框架支持 | |------|------|-------------| | Single-Task Search | 解决一个难题，无需 dataset | ✅ AlphaEvolve, OpenEvolve | | Multi-Task Search | 跨任务交叉迁移优化 | ❌ **独有** | | Generalization | 构建可迁移到未见问题的技能 | ❌ **独有**（原 GEPA prompt 优化） | ### 关键机制 **ASI（Actionable Side Information）**： - 诊断反馈成为 evaluator 契约的一等公民 - 支持文本/结构化数据/图像（via `gepa.Image`） - VLM 可以"看到"自己输出的渲染结果进行改进 - ASI ≈ 文本优化的梯度 **Pareto 前沿搜索**： - 追踪每个任务/指标单独的分数，维持 Pareto 前沿 - 每个 reflection 步只展示 2-3 个示例，避免平均化隐藏弱点 - 专注、靶向改进，保留互补优势 ### 实验结果 | 领域 | 模式 | 结果 | |------|------|------| | Claude Code Agent Skills | Generalization | 通过率 79.3% → 100%，速度 +47% | | CloudCast 云调度 | Generalization | 成本降低 **40.2%**，超专家启发式 | | Can't Be Late 调度 | Generalization | 成本降低 7.8% | | ARC-AGI Agent 架构发现 | Generalization | 32.5% → **89.5%**（+57pp） | | CUDA Kernel 生成 | Multi-Task | 跨任务迁移优于专用单任务优化 | | Prompt 优化 | Generalization | GPT 数学推理提升 | | Circle Packing | Single-Task | 超越 AlphaEvolve | | 黑箱数学优化 | Single-Task | 匹敌 Optuna | | 3D Unicorn 建模 | Single-Task | 从零生成 3D SVG | ### 关键洞察 1. **声明式 API**：与 DSPy 的"编程而非提示"原则一致，用户声明 what（artifact + evaluator），系统负责 how（搜索策略） 2. **ASI > 单一分数**：ASI 类似于梯度，区别于传统优化将诊断上下文压缩为单一标量 3. **Pareto 搜索保留互补优势**：跨多维度的优秀候选不被平均分数埋没 4. **全栈优化**：不只优化 prompt，可以优化整个 Agent 系统（代码+架构+控制流+prompt），10行种子 → 300+行系统 5. **多任务迁移**：Multi-Task 模式让不同任务的优化模式互相迁移，这是先前框架无法表达的 --- *评审：Value 8 × Confidence 8 = 64 | ★★★★ | 推荐入库*