--- title: "Skill Factory:三天手搓面向Harness设计的技能工厂" sha256: 8dafd9bc505f8d6d9a272e6f0bebbffa23be5e5ef2b45e398c18f1a007f7d45d source_url: https://mp.weixin.qq.com/s/tm7M3N8f45K87YUTwERkhg author: 月珩 publisher: 阿里云开发者 published: 2026-05-14 created: 2026-05-14 type: raw tags: - skill-system - skill-factory - llm-agent - harness - tdd - trace2skill - 月珩 review_value: 7 review_confidence: 7 review_recommendation: worth-reading review_stars: 3 summary: Skill Factory 测试驱动技能生成平台——多路并发生成3策略择优、TDD验证闭环、Trace2Skill轨迹蒸馏、SkillRL强化学习联调、三种skill创建模式对比表(人工vs对话AI vs SkillFactory)。 --- ## 背景:三种 Skill 创建方式对比 | 模式 | 核心逻辑 | 生产效率 | 代码质量 | 测试验证 | 多方案探索 | 核心缺陷 | |------|---------|---------|---------|---------|-----------|---------| | **模式一:人工编写** | 人脑驱动,完全依赖个人经验 | 低(天/周) | 波动大 | 无自动化闭环 | 单线程 | 效率瓶颈 & 质量黑盒 | | **模式二:OpenClaw/Claude Code** | 对话驱动,依赖 Prompt 技巧 | 高 | 随机性强 | 无自动化闭环 | 串行迭代 | 不可控 & 缺乏工程验证 | | **模式三:SkillFactory** | 流程驱动,标准化流水线 + TDD | 高 | 标准化高 | **先有测试用例,再生成 skill,自动回归验证** | **多路并行竞优(3策略同时生成)** | 初期搭建成本高 | --- ## 核心问题与动机 两种主流方式的局限: - **模式一(人工)**:效率低、质量波动、测试覆盖不足、原子逻辑重复造轮子 - **模式二(对话 AI)**:非确定性探索、缺乏自动化验证闭环、一次只生成一版、需多轮交互 **Skill Factory 出发点**:面向 Harness 设计,用 TDD 思路做技能生成。 --- ## 产品功能:测试驱动技能生成流水线 ### 1. 技能定义 用户输入:想生成的技能 + 测试问题 + API 接口(后续支持 SOP 文档挂载) ### 2. 基线诊断 判断是否有必要生成新 skill: - **裸模型评估**:直接让模型执行目标任务,作为基线对照 - **Skill 匹配分析**:召回相似 skill,执行测试问题,评估现有 skill 是否满足需求 → 失败点和不确定行为 = Skill 需要解决的真实能力缺口 ### 3. 多路并发 Skill 生成 **核心思路**:并行调用 3 种不同策略/模型/Prompt 模板的 Creator,相当于"一次性买三张不同号码的彩票"。 **结果**:只要其中一路生成高质量代码,整个任务就成功。极大提高 **First-Time Pass Rate**。 调研参考: - Anthropic `skill-creator` - OpenClaw `skill-creator` - Superpowers(GitHub 138k ⭐)的 `writing-skills` ### 4. 回归迭代 **测试阶段**:从格式规范、复用创新、功能可用性、运行稳定性、文档规范五个维度评价打分 **优化阶段**:生成优化版本 skill,支持下载或发布 ### 5. 质量检查 --- ## 生态适配 基于知流平台的 MCP / HTTP / Dify Agent 工具,可直接生产技能。 --- ## 迭代方向 ### Trace2Skill:轨迹 → 技能 千问团队 Distill Trajectory-Local Lessons into Transferable Agent Skills: > Trace2Skill 本质:将智能体的"隐性经验"(大量具体执行轨迹)转化为"显性知识"(结构化技能文档) **关键结论**:高质量技能不需要依赖昂贵的人工编写,也不需要更新模型参数,仅通过开源小模型进行轨迹分析,就能提炼出通用的专家级能力。 → 基于日志数据沉淀可固定技能,有利于 Agent 稳定执行长程任务 ### SkillRL 联调方向 把智能体与环境交互产生的冗长轨迹蒸馏成紧凑、可复用的"技能卡片",并在**强化学习训练过程中让技能库与策略共同进化**。 ### 虚拟环境回归 对于不能实际执行的 skill,考虑模拟虚拟环境让 Agent 进行测试回归。 --- ## AI Coding 实践 开发过程中使用的 AI 编程工具: | 工具 | 用途 | |------|------| | idealab | 产品功能页面详细设计 | | Qoderwork | 产品功能页面详细设计 | | 爱码仕 | 前端页面生成 | | 灵码 aonecopilot | Debug/优化/生成整体编码框架 demo | --- ## 参考链接 - [Trae IDE: How to write a good skill](https://docs.trae.cn/ide/best-practice-for-how-to-write-a-good-skill) - [Anthropic Skills](https://github.com/anthropics/skills) - [OpenClaw skill-creator](https://github.com/openclaw/openclaw/tree/main/skills/skill-creator)